Gestão de Dados Científicos
No que tange à gestão de dados científicos, é essencial ter em conta a representação dos dados e o seu armazenamento. Para obter uma melhor organização dos dados, estes devem estar inseridos em coleções e devem ser indexados para uma melhor recolha dos dados (Ribeiro, Fernandes, 2011).
É importante destacar que existe uma hierarquia de níveis de gestão de dados científicos, composta por uma pirâmide de quatro camadas, nomeadamente, internacional (Recursos internacionais relevantes), nacional (Centros de dados nacionais), institucional (Repositórios institucionais – Memória Científica) e pessoal (Coleções individuais e comunitárias). As camadas mencionadas dizem respeito à disponibilidade para o acesso, aos níveis de investimento, às infraestruturas necessárias, às responsabilidades que a mesma acarreta, às ferramentas utilizadas e a importância que estas possuem para a ciência. Esta hierarquia é uma reflexão dos níveis de permanência dos dados e o grau de padronização de procedimentos a que eles estão sujeitos (Sayão, Sales, 2016).
No que se refere aos objetivos da gestão de dados científicos, pode-se mencionar o facto de estes precisarem de ser “compreendidos e interpretados por outros pesquisadores ao longo do tempo”. Para que tal se verifique, é imperioso realizar uma descrição clara e pormenorizada dos dados, além de acrescentar anotações e informações que contextualizem os dados e proporcionem a transmissão de informação, bem como o conhecimento no tempo e no espaço (Sayão, Sales, 2015 Cit. por Monteiro, Sant’Ana 2017, p.2).
Data Literacy
Koltay (2017 apud Reis, 2019) alega que Data Literacy ou Alfabetização de Dados refere-se à capacidade de processar e classificar grandes quantidades de informação, pelo que o profissional deverá ser capaz de pesquisar, filtrar, processar, produzir e sintetizar, todos os dados obtidos nesse processamento e posterior classificação da informação. O conjunto de atributos supramencionados serão potencializados com a competência informacional em dados, que engloba atividades como a gestão e curadoria de dados, constituindo uma vantagem para os profissionais, pois torna-os devidamente qualificados no contexto dos dados e da sua alfabetização.
Reis (2019) acrescenta ainda que os profissionais da informação requerem uma aprendizagem e uma alfabetização sobre os dados e a ciência dos dados, apresentando um pensamento crítico para a resolução de problemas, com capacidade para aprender, interpretar e conhecer os dados, desenvolvendo aptidões para lidar com esse tipo de serviços e para a pesquisa orientada a esses dados, visto que a Data Literacy é um fator cada vez mais essencial para a atual sociedade da Ciência dos Dados e para a Ciência da Informação.
Assim sendo, segundo Reis (2019), as competências intrínsecas à Alfabetização de Dados passam por cinco etapas, nomeadamente a Estrutura Conceitual (introdução aos dados), a Recolha (descoberta, organização e manipulação de dados), a Gestão (criação e utilização de metadados, curadoria, preservação, ferramentas, análise e interpretação de dados), a Avaliação (identificação de problemas na utilização de dados, visualização e tomada de decisão com os dados) e a Aplicação (ética, citação, partilha e avaliação de decisões baseadas nos dados) desses dados.
Neste sentido, foi fundamental a reeducação dos indivíduos, dos processos e das tecnologias, no sentido de desenvolver a sua capacidade para ler, compreender, criar e comunicar os dados como uma informação estratégica, o que constitui o objetivo primordial da Data Literacy:
Desenvolver o sólido conhecimento da literacia de dados é essencial para a construção de conhecimentos específicos de domínio disciplinar e para garantir que os cidadãos possam utilizar e aplicar essas habilidades de forma adequada e diversamente ao longo de suas vidas pessoais e profissionais
RIDSDALE et al., 2015, p. 2 citado por Reis, 2019.
Open Science
A Ciência Aberta ou Open Science, é um conceito deveras importante na atualidade, tendo vindo a ganhar cada vez mais visibilidade, tornando-se uma componente fulcral na pesquisa e comunicação científica.
A Ciência Aberta enfatiza a necessidade de acesso livre a publicações científicas e também aos dados resultantes dos projetos de pesquisa (OLIVEIRA, SILVA, 2016).
Guandalini; Furnival; Arakaki (2019) acrescentam que este conceito não se baseia somente em disponibilizar um conteúdo em acesso aberto, mas também a todo o seu desenvolvimento, o que proporciona uma maior colaboração, facilitando a comunicação científica e dando origem a um maior avanço. Assim, Chan; Okune; Sambuli (2015, p. 103) citados por Guandalini; Furnival; Arakaki (2019) afirmam que a ciência aberta também pretende aumentar a visibilidade e o impacto da pesquisa a nível local, bem como tornar mais simples a participação dos investigadores em colaborações locais e internacionais e fomentar a cultura da partilha do conhecimento, assim como uma nova reflexão acerca da inovação social.
Segundo Oliveira e Silva (2016), a ciência aberta estrutura-se à volta de grandes conjuntos de dados, exigindo sofisticadas bases de dados para a sua gestão, que permitem a simulação e criação de modelos nas diversas áreas do conhecimento. Ainda se refere que o conceito em questão contribui para a realização de novas pesquisas e investigações, através da utilização e reaproveitamento dos dados de pesquisa.
Neste sentido, cabe ainda frisar que a ciência aberta apresenta um papel fulcral no que concerne ao “bem comum”, no enriquecer da cidadania e contribui também para uma sociedade mais justa (Albagli; Clinio; Raychtock, 2014).
Numa última análise, este conceito tem como objetivo a disponibilização do conhecimento científico para que os utilizadores, independentemente de serem ou não cientistas/investigadores, consigam usar, reusar e distribuir sem qualquer tipo de constrangimento social, económico ou legal os dados de investigação (Sayão, Sales, 2014 Cit. por Monteiro; Lucas; Lecardelli, 2019).
Open Data
No que diz respeito ao Open Data, que em português corresponde a “Dados Abertos”, é um conceito que destaca fundamentalmente a transparência na divulgação dos dados, com a finalidade de estabelecer uma possível reutilização dos mesmos (Guandalini; Furnival; Arakaki, 2019).
De acordo com Máchová & Lněnička (2017) apud Pagaime (2018), no decorrer dos anos, os governos de cada país começaram por desenvolver e implementar iniciativas de dados abertos, permitindo a disseminação de dados no formato aberto e reutilizável, sem qualquer tipo de restrições ou pagamento pela sua utilização por parte dos indivíduos. Com efeito, foram surgindo repositórios, catálogos e portais de dados abertos, em grande quantidade.
É oportuno frisar que a difusão e disponibilização de dados abertos ao público e o despontar de mercados de dados representam uma oportunidade para governos, empresas e empresários, de modo a tirar proveito do valor desses mesmos dados, para conseguir lucros económicos, sociais e científicos (Sadiq & Indulska, 2017 apud Pagaime, 2018).
Diante desta realidade, na perspetiva de Pereira et al. (2017) apud Pagaime (2018), os dados devem permanecer disponíveis para todos os indivíduos que tenham algum propósito para a sua utilização, sendo que os mesmos podem ser acedidos, alterados e reutilizados para qualquer fim. Assim, estes dados vão ser redistribuídos para que a participação seja universal, isto é, de forma a que todos os indivíduos consigam utilizar os mesmos sem qualquer tipo de discriminação, seja ela por campos, pessoas ou grupos.
Plano de Gestão de Dados
Na verdade, o avanço tecnológico vem aumentar cada vez mais a possibilidade de se poder trabalhar com os dados periodicamente capturados e em larga escala, assim é importante que estes sejam geridos e planeados de forma segura para garantir a interpretação e reutilização em novas investigações (Veiga et al., 2019).
De certo modo, o plano de gestão de dados é um documento que tem como função descrever o tratamento dos dados durante um projeto de pesquisa e o que acontece com esses dados após finalizar a pesquisa. Cabe ressaltar que os planos de gestão de dados abordam o ciclo de vida dos dados, desde que são descobertos, recolhidos e organizados até como irão ser preservados. (Michener, 2015 Cit. por Guandalini; Furnival; Arakaki, 2019).
É importante destacar que o template do plano é desenvolvido e sugerido pelas respetivas instituições de ensino, bem como os órgãos públicos e agências de fomento à pesquisa. Por vezes, estas necessitam que os seus investigadores incluam o plano no seu projeto, com a finalidade de desenvolver um padrão que possa ser disponibilizado de forma detalhada sobre como vai ser efetuada a gestão de dados, estabelecendo uma prática na comunicação científica.
Segundo Michener (2015) cit. por Guandalini; Furnival; Arakaki (2019) são apresentadas dez diretrizes de como criar um bom Plano de Gestão de Dados, sendo estas:
- a determinação dos requisitos de pesquisa;
- a identificação dos documentos a serem recolhidos;
- a definição de como os dados serão organizados;
- a explicação de como estes serão documentados;
- a descrição de como a qualidade dos dados será assegurada;
- a apresentação de uma estratégica sólida de armazenamento e preservação de dados;
- a definição das políticas de dados do projeto;
- a descrição de como os dados são divulgados;
- a atribuição de funções e responsabilidades;
- e por fim, conceber um orçamento realista.
Decerto que as regras mencionadas anteriormente necessitam de ser tidas em conta na elaboração de um Plano de Gestão de Dados, uma vez que servem como guia, evitando e minimizando o risco de equívocos.
A Ciência da Informação nas políticas de Dados Abertos Científicos
Atualmente, os dados de pesquisa digitais constituem um fluxo que está em constante crescimento, surgindo várias dificuldades no que toca ao correto armazenamento da informação, para que estes possam ser reutilizáveis em novos projetos. Neste sentido, verifica-se a importância da gestão dos dados, no que diz respeito ao campo científico.
Segundo Sayão e Sales (2012) cit. por Guandalini; Furnival; Arakaki (2019), existem novas perspetivas ligadas à produção científica, que apresentam uma gestão dos dados mais coerente e eficaz. Os autores supracitados referem essa perspetiva num quarto paradigma, onde a Ciência uniformiza experiências, teorias e simulações, mediante o uso intenso de dados, que são capturados por instrumentos com um maior nível de inovação, processados por softwares e armazenados em computadores na forma de bases de dados.
Deste modo, é pertinente mencionar que o termo “Curadoria Digital” advém da gestão de recursos digitais como uma prática que têm como principal propósito a preservação e o acesso, através de um conjunto de técnicas (Sayão, Sales, 2012 cit. por Guandalini; Furnival; Arakaki, 2019).
Seguidamente, a curadoria de dados científicos consiste em acrescentar velocidade ao ciclo da comunicação científica, proporcionando dados prontos para a reutilização por parte dos investigadores, isto é, dados tratados que são acompanhados por metadados, garantindo a reconstrução correta da sua apresentação, acrescidos a metadados que asseguram a integridade, precisão e autenticidade (Sayão e Sales, 2012 cit. por Guandalini; Furnival; Arakaki, 2019).
Nesta ordem de ideias, para os investigadores reutilizarem os dados científicos, é recomendável que os mesmos estejam armazenados em repositórios destinados para esse efeito, sendo que a instituição pode ou não viabilizar opções para repositórios digitais. Posto isto, surgem desafios inerentes à reutilização dos dados, bem como às publicações científicas, mais concretamente o Direito Autoral, que é um aspeto primordial no que toca às boas práticas da comunicação científica que envolvem justamente os profissionais da informação (Guandalini; Furnival; Arakaki, 2019).
Com o movimento dos dados abertos, o direito autoral vem influenciar as estratégias de inovação, tornando-se um tópico essencial nos dias de hoje, precisamente pela produção científica se inserir no meio digital (Guandalini; Furnival; Arakaki, 2019).
Em suma, no decorrer do desenvolvimento da gestão de dados científicos, a comunicação científica é beneficiada, uma vez que esta possui a oportunidade na melhoria do conhecimento criado pelas pesquisas. Desta forma, o direito autoral surge em colaboração com os investigadores para partilharem os seus dados de uma forma mais segura (Guandalini; Furnival; Arakaki, 2019).
Referências Bibliográficas
- ALBAGLI, Sarita; CLINIO, Anne; RAYCHTOCK, Sabryna – Ciência Aberta: correntes interpretativas e tipos de ação [Em linha]. Liinc em Revista. Vol.10, nº2 (2014), p.434-450. [Consult. 13 fev. 2020]. Disponível em WWW:<URL: https://www.brapci.inf.br/index.php/res/v/93946>.
- GUANDALINI, Clara Alcina; FURNIVAL, Ariadne Chloë Mary; ARAKAKI, Ana Carolina Simionato – Boas práticas científicas na elaboração de planos de gestão de dados [Em linha]. RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação. Vol.17 (2019), p.1-20. [Consult. 11 Mar. 2020]. Disponível em WWW: <URL: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8655895/21554> ISSN 1678-765X.
- MONTEIRO, Cristiana de Sousa de Aguiar; SANT’ANA, Ricardo Cesar Gonçalves – Plano de Gerenciamento de Dados no Contexto dos Repositórios de Dados das Universidades [Em linha]. Brasil, I Workshop de Informação, Dados e Tecnologia, UFSC, 2017. [Consult. 14 fev. 2020]. Disponível em WWW:<URL: https://repositorio.ufsc.br/xmlui/bitstream/handle/123456789/180293/ST3.2.pdf?sequence=1&isAllowed=y>.
- MONTEIRO, Gabriela; LUCAS, Elaine R. de Oliveira; LECARDELLI, Jane – Financiadores da pesquisa brasileira e os dados científicos abertos [Em linha]. Barcelona: IX Encontro Ibérico EDICIC, 2019. [Consult. 13 fev. 2020]. Disponível em WWW:<URL: http://eprints.rclis.org/38555/1/Artigo_EDICIC_preprint_Versao_E-Lis.pdf> .
- OLIVEIRA, Adriana Carla Silva de; SILVA, Edilene Maria da – CIÊNCIA ABERTA: DIMENSÕES PARA UM NOVO FAZER CIENTÍFICO [Em linha]. Informação & Informação. Vol. 21, nº2 (2016), p.5-39. [Consult. 13 fev. 2020]. Disponível em WWW:<URL: http://www.uel.br/seer/index.php/informacao/article/view/27666/20113>.
- PAGAIME, Rúben Gonçalo Teixeira – GESTÃO DA QUALIDADE DOS DADOS EM CONTEXTO DE DADOS ABERTOS [Em linha]. Lisboa: Instituto Superior de Estatística e Gestão de Informação, 2018. Dissertação de Mestrado. [Consult. 13 fev. 2020]. Disponível em WWW:<URL: https://run.unl.pt/bitstream/10362/64939/1/TGI0219.pdf>.
- REIS, Makson de Jesus – Ciência de dados e ciência da informação: guia para alfabetização de dados para bibliotecários [Em linha]. São Cristóvão: Universidade Federal de Sergipe, 2019. Dissertação de Mestrado. [Consult. 21 maio de 2020]. Disponível em WWW: <URL: https://ri.ufs.br/bitstream/riufs/12667/2/MAKSON_%20JESUS_REIS.pdf>.
- RIBEIRO, Cristina; FERNANDES, Maria Eugénia Matos – Curadoria de Dados na Universidade do Porto: Identificação de práticas em diversas áreas disciplinares [Em linha]. CONFOA, 2011. [Consult. 14 fev. 2020]. Disponível em WWW:<URL:https://conferencias.rcaap.pt/confoa2011/confoa2/paper/view/80>
- SAYÃO, Luis Fernando; SALES, Luana Farias – ALGUMAS CONSIDERAÇÕES SOBRE OS REPOSITÓRIOS DIGITAIS DE DADOS DE PESQUISA [Em linha]. Informação & Informação. Vol.21, nº2 (2016), p.90-115. [Consult. 13 fev. 2020]. Disponível em WWW: <URL: http://www.uel.br/revistas/uel/index.php/informacao/article/view/27939/20122>.
- VEIGA, Viviane Santos De Oliveira; HENNING, Patricia; DIB, Simone; PENEDO, Erick; SILVA, Luiz Olavo Bonino da; PIRES, Luís Ferreiro – Plano de gestão de dados FAIR: uma proposta para a Fiocruz [Em linha]. Rio de Janeiro: Liinc em Revista, 2019. [Consult. 12 Mar. 2020]. Disponível em WWW: <URL: https://www.arca.fiocruz.br/handle/icict/37896>.
