Perguntas e respostas - Dados

Este conjunto de perguntas e respostas foi pensado para te guiar no processo de gestão de dados de investigação.

Na gestão de dados de investigação, ou curadoria de dados, estão envolvidos diferentes processos, técnicas, intervenientes e responsabilidades, sendo necessárias competências específicas que abrangem várias ações no âmbito do planeamento, criação, documentação, acesso, utilização, armazenamento, partilha e preservação dos dados.

Os benefícios da gestão de dados são:

  • Cumprir os requisitos do financiador;
  • Assegurar a integridade e reprodutibilidade da investigação;
  • Aumentar a eficiência da investigação;
  • Assegurar que os dados e registos de investigação são precisos, completos, autênticos e confiáveis;
  • Economizar tempo e recursos a longo prazo;
  • Aprimorar a segurança dos dados e minimizar o risco da perda de dados;
  • Prevenir a duplicação de esforços, permitindo que outros utilizem os seus dados;
  • Cumprir com as práticas conduzidas na indústria e comércio;
  • Possibilitar a comparação dos dados nos vários momentos do ciclo de investigação.

Sugere-se a observância da seguinte lista de verificação para a gestão dos dados de investigação:

  1. Criação de um Plano de Gestão de Dados;
  2. Dados e ficheiros organizados logicamente;
  3. Utilização de textos e rótulos consistentes;
  4. Registo dos metadados metodológicos;
  5. Disponibilização dos ficheiros num formato comum e durável, sempre que possível (Exemplo: CSV, não XLS);
  6. Armazenamento dos dados num local seguro (Exemplo: Cloud, não no disco do computador);
  7. Realização de back-ups;
  8. Aplicação de um período de retenção;
  9. Identificação clara da autoria dos dados;
  10. Cumprimento das diretrizes éticas;
  11. Publicação do registo de metadados ao nível da coleção num portal de pesquisa relevante;
  12. Aplicação de uma licença adequada;
  13. Atribuição de um DOI para permitir a citação do conjunto de dados.

 

Fonte: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020) disponível online na Plataforma NAU.

 

Findable | Accessible | Interoperable | Reusable

Os princípios FAIR propostos para guiar a gestão dos dados de investigação preconizam quatro princípios basilares que devem guiar o ciclo de vida dos dados no processo de investigação.

 

Findable (Localizáveis)

L1. (meta)dados associados a identificadores globais, únicos e persistentes.

L2. dados descritos com metadados pormenorizados.

L3. (meta)dados registados ou indexados em recursos de pesquisa.

L4. metadados especificando o identificador dos dados.

 

Accessible (Acessíveis)

A1. (meta)dados são recuperáveis através do seu identificador usando um protocolo de comunicações normalizado.

A2. protocolo aberto, gratuito e de implementação universal.

A3. protocolo permite procedimentos de autenticação e autorização, quando necessário.

A4. metadados acessíveis, mesmo quando os dados já não estão disponíveis.

 

Interoperable (Interoperáveis)

I1. (meta)dados utilizam uma linguagem formal, acessível, partilhada e largamente aplicável para representação do conhecimento.

I2. (meta)dados utilizam vocabulários que seguem os princípios FAIR.

I3. (meta)dados contêm referências qualificadas a outros (meta)dados.

 

Reusable (Reutilizáveis)

R1. meta(dados) têm uma grande diversidade de atributos precisos e relevantes.

R1.1. (meta)dados são disponibilizados com uma licença de uso de dados clara e acessível.

R1.2. (meta)dados têm associada a sua proveniência.

R1.3. (meta)dados seguem as normas relevantes na comunidade disciplinar.

Fonte: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020) disponível online na Plataforma NAU.

Os Planos de Gestão de Dados são elementos chave para uma boa gestão no decorrer de um projeto de investigação. Descrevem todo o ciclo de vida dos dados, desde a sua recolha, processamento, tratamento, disponibilização ao acesso. São documentos vivos, que evoluem e ganham maior precisão e substância à medida que o projeto  de investigação se desenvolve, uma vez que nem todos os dados ou potenciais usos são claros desde o princípio.

Checklist for a Data Management Plan Lista de verificação, desenvolvida pelo Digital Curation Centre, que apresenta as principais questões que um investigador deve abordar aquando da preparação de um Plano de Gestão de Dados.

 

Os Plano de Gestão de Dados são documentos que definem:

  • Que dados serão criados ou recolhidos
  • Como os dados serão criados ou gerados;
  • Como serão documentados;
  • Como serão partilhados;
  • Quem poderá aceder aos dados;
  • Onde e como serão guardados;
  • Quem fica responsável pela sua gestão e preservação;
  • Se e como os dados podem ser partilhados e reutilizados;
  • Como lidar com questões éticas, de direitos de autor e propriedade intelectual

 

Os Planos de Gestão de Dados:

  • Permitem encontrar e compreender os dados quando precisar de os usar;
  • Garantem continuidade após saída de elementos da equipa do projeto, ou na entrada de novos investigadores;
  • Evitam duplicação de trabalho;
  • Dados de apoio a publicações são mantidos, permitindo a validação de resultados;
  • Promovem a partilha e a colaboração e consequentemente avanços na investigação;
  • A investigação torna se mais visível e ganha maior impacto;
  • Outros investigadores podem citar os seus dados

 

Ferramentas para o desenvolvimento de um Plano de Gestão de Dados:

ARGOS – https://argos.openaire.eu/

O ARGOS, apresenta-se como uma ferramenta online de apoio nos processos de criação, gestão, de partilha e ligação dos Planos de Gestão de Dados aos resultados de investigação, corroborando as melhores práticas “FAIR data” e de abertura dos dados. Esta assunção é ultimada a partir da adoção e inclusão de um conjunto de normativos para PGDs acionáveis / interoperáveis por máquina, definido pela RDA (Research Data Alliance). Recentemente foi traduzido para português, por forma a facilitar e agilizar a criação do PGD e a sua integração no ciclo de Gestão de Dados de Investigação e que, muito em breve, integrará também o modelo de Plano de Gestão de Dados da FCT.

 

ARIADNEplus – https://vast-lab.org/dmp/ariadneplus/form/

O ARIADNEplus é um projeto financiado pela Comissão Europeia, sob o programa Horizonte 2020. Esta iniciativa disponibiliza diversos serviços, de entre os quais se destaca um plano de gestão de dados online denominado de DMP Researcher Template for Archaeological Dataset, dirigido a arqueólogos e investigadores nesta área científica.

 

Data Stewardship Wizard – https://ds-wizard.org

O Data Stewardship Wizard é uma ferramenta online que resulta de uma parceria entre o ELIXIR CZ e o ELIXIR NL. Esta aplicação visa dar apoio aos investigadores na criação e manutenção de planos de gestão de dados e no cumprimento dos princípios FAIR.

 

DMPonline – https://dmponline.dcc.ac.uk/

Ferramenta online, desenvolvida pelo Digital Curation Centre, que apoia os investigadores na preparação de planos de gestão de dados. Esta ferramenta integra os modelos mais recentes de financiadores e também orientações das melhores práticas para a criação de planos de gestão de dados de qualidade.

 

DMPTool – https://dmptool.org/

O DMPTool é uma ferramenta online que permite criar e editar planos de gestão de dados personalizados. Esta ferramenta permite: criar planos de gestão de dados prontos a usar para financiadores, cumprir os respetivos requisitos e obter orientações para os dados do plano de gestão.

 

Easy.DMP – https://easydmp.eudat.eu

Desenvolvido pelo Sigma2 em colaboração com o EUDAT, o easyDMP tem como objetivo disponibilizar uma ferramenta que permita aos investigadores com o mínimo de experiência em gestão de dados, uma forma simples de criar planos de gestão de dados. Para tal, esta ferramenta procede à transformação das orientações das agências de financiamento para a gestão de dados, num conjunto de questões de fácil resposta, muitas delas de resposta pré-definida.

Fontes: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020). Disponível online na Plataforma NAU.

Príncipe, Pedro, Moura, Paula, Vieira, André, Pereira, Filipa, Relatório Técnico sobre Ferramentas para a Elaboração de Planos de Gestão de Dados (2020). Disponível em http://hdl.handle.net/1822/67530 Consultado a 09/07/2021.

 

 

O acesso aberto aos dados de investigação enquadra-se no movimento da Ciência Aberta, que advoga uma maior abertura e transparência nos processos científicos. O Open Data Institute (ODI) define os dados abertos como aqueles que qualquer pessoa pode aceder, usar e compartilhar. De acordo com o ODI, os dados abertos devem ser licenciados para deixar claro que qualquer um pode usar os dados da maneira que quiser, incluindo transformá-los, combiná-los e compartilhá-los com outros, mesmo para fins comerciais.

Um crescente número de agências de financiamento e instituições de I&D têm vindo a adotar políticas relativas à gestão e partilha dos dados produzidos no âmbito de projetos de investigação. Estas políticas ou mandatos fundamentam-se não apenas no intuito de redução dos custos associados à recolha de dados evitando a sua duplicação, mas também nos aspetos relacionados com a maximização do acesso e a reprodutibilidade da investigação. Conhece as especificações de algumas das políticas de financiadores na seguinte página do Digital Curation Center: http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies

Requisitos dos principais financiadores

 FCT

Nas candidaturas a financiamento apresentadas à Fundação para a Ciência e a Tecnologia, sugere-se que os candidatos incluam um Plano de Gestão de Dados e outros resultados da investigação, contendo informação específica sobre o modo como promoverão a ampla disseminação e partilha dos resultados de I&D.

A FCT, na sua Política sobre a Disponibilização de Dados e outros Resultados de Projetos de I&D Financiados Pela FCT, encoraja os investigadores a disponibilizar os dados resultantes dos projetos de I&D que financia total ou parcialmente em acesso aberto, sempre que possível. À semelhança do Horizonte 2020, “a disponibilização dos resultados não pode, em qualquer circunstância, incluir informação que comprometa a privacidade ou a segurança de indivíduos ou entidades envolvidos na investigação, sujeitando-se aos condicionalismos legais vigentes.”

Recomendações aos beneficiários de financiamento:

Nas candidaturas a financiamento apresentadas à FCT, sugere-se que:

  1. os candidatos efetuem um plano de gestão de dados incluindo:
  • descrição dos dados;
  • normas a serem usadas para formatos e conteúdo de dados e metadados;
  • políticas de acesso e partilha;
  • políticas e disposições para reutilização, redistribuição e produção de subprodutos;
  • planos para arquivo de dados, amostras, software, modelos e outros materiais produzidos;
  1. os dados sejam depositados em repositórios apropriados (ex: GenBank);
  2. façam referência à entidade financiadora (FCT).

 

Horizonte 2020

A Comissão Europeia promove uma política de dados abertos que visa melhorar e maximizar o acesso e reutilização dos dados. O procedimento relativo aos dados de investigação é detalhado no artigo 29.3 das Guidelines on Multi-Beneficiary General Model Grant Agreement. Os projetos com fundos públicos do Horizonte 2020 devem:

  • Criar e manter atualizado um Plano de Gestão de Dados (até 6 meses após início do projeto);
  • Assegurar o depósito dos dados num repositório confiável;
  • Documentar os dados para validação;
  • Disponibilizar os dados de investigação em acesso aberto, sempre que possível.

Este requisito aplica-se a:

  • Dados necessários para a validação dos resultados em publicações científicas;
  • Outros dados resultantes do projeto e especificados no Plano de Gestão de Dados.

 

Horizonte Europa

A Ciência Aberta é entendida, nos documentos oficiais do Horizonte Europa (General Model Grant Agreement e Horizon Europe Programme), como uma abordagem ao processo científico, baseada no trabalho colaborativo, na utilização de ferramentas abertas e na difusão do conhecimento, para promoção da excelência e do impacte da investigação financiada por fundos públicos. Os projetos com financiamento do Horizonte Europa devem:

  • Gerir os dados de acordo com os princípios FAIR (findable, accessible, interoperable, reusable);
  • Apresentar um Plano de Gestão de Dados nos primeiros 6 meses do projeto e a atualização do mesmo ao longo do projeto, sempre que houver alterações;
  • Fazer o depósito dos dados num repositório certificado;
  • Disponibilizar os dados em acesso aberto se possível e assim que possível, sob uma licença CC BY, de acordo com o princípio “as open as possible, as closed as necessary”;
  • Metadados abertos, com licenças CC 0, incluindo informação sobre licenças e identificadores persistentes, entre outros.

 

As open as possible, as closed as necessary

No quadro de financiamento do H2020 e Horizonte Europa, os projetos podem optar por não partilhar os dados em acesso aberto, desde que se apresente uma justificação no plano de projeto, com base em:

  • Se o projeto não gerar/recolher dados;
  • Em caso de conflito com a obrigação de proteção dos resultados (se é esperado que os resultados sejam comercial ou industrialmente explorados);
  • Se a realização do objetivo principal do projeto (ação) ficar comprometido com a disponibilização aberta dos dados.
  • Em caso de conflito com as obrigações de confidencialidade;
  • Em caso de conflito com as obrigações nacionais de segurança;
  • Em caso de conflito com as regras em matéria de proteção de dados pessoais.

 

Proteção de dados

Os aspetos relacionados com a proteção de dados são cruciais para o processo de investigação, especialmente se estiver planeada a partilha dos dados de investigação. A proteção dos dados de investigação significa proteger os direitos das pessoas envolvidas no processo de investigação. Na lista seguinte são apresentadas algumas ações a ter em conta ao iniciar cada novo projeto:

  • Analisar se é realmente necessário recolher dados pessoais para realizar a investigação;
  • Considerar a recolha de dados de forma anónima, se possível;
  • Identificar quais os dados pessoais que poderão ser incluídos na investigação;
  • Incluir aspetos de proteção de dados no plano de gestão de dados;
  • Criar e utilizar formulários de consentimento;
  • Definir uma estratégia de anonimização apropriada para a investigação;
  • Garantir o armazenamento, controlo de acesso e transferência de dados com segurança.

Em abril de 2016, a União Europeia adotou o seu regulamento relativo à proteção das pessoas singulares no que diz respeito ao tratamento de dados pessoais e à livre circulação desses dados, o Regulamento Geral sobre a Proteção de Dados (RGPD). O RGPD tornou-se obrigatório em maio de 2018. Ao recolher e/ou tratar dados pessoais, os investigadores são obrigados a seguir uma série de princípios, incluindo:

  • Transparência: tratamento de dados pessoais de modo lícito, equitativo e transparente;
  • Minimização dos Dados: a utilização dos dados será limitada ao objetivo da respetiva investigação;
  • Integridade e confidencialidade: os dados devem ser protegidos por medidas de segurança adequadas (técnicas e organizacionais).

 Quanto à recolha de dados pessoais, o RGPD inclui uma isenção para a investigação:

  • se disser respeito “ao interesse público, a fins de investigação científica ou histórica ou a fins estatísticos” (Art. 5.1 2016/679/EU); ou
  • se “o titular dos dados tiver dado o seu consentimento para o tratamento dos seus dados pessoais para uma ou mais finalidades específicas” (Art. 6.1 2016/679/EU).

 

Fonte: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020). Disponível online na Plataforma NAU.

 

O depósito num repositório digital tem a função particularmente importante de assegurar a integridade digital dos pacotes de dados a longo prazo, através de variadas medidas de preservação digital. É portanto um passo essencial para o acesso livre e sustentável a longo prazo. Para além disso, a escolha do repositório está relacionada com o esquema de metadados adotado, de forma a garantir que a descrição dos dados corresponda às diretrizes usadas pelo repositório escolhido ou que seja interoperável com o mesmo. Recomenda-se explicitamente a preferência por repositórios de dados certificados, atendendo às diretrizes do respetivo selo de certificação. Existem diferentes agências que certificam repositórios e, por isso, diferentes critérios para a certificação.

Idealmente os dados de investigação deverão ser depositados num repositório institucional,  repositório disciplinar ou num repositório mais generalista. Algumas dicas para encontrares o repositório de dados ideal para o teu projeto de investigação:

  • Usa um repositório disciplinar, se existir;
  • Em alternativa, usa o repositório de dados institucional (caso exista) ou outro que garanta a preservação a longo prazo. Em caso de dúvida, consulta o org e encontra o repositório que melhor se ajusta às necessidades do teu projeto e que reúna as condições exigidas pelo financiador;
  • Usa um repositório generalista como o Zenodo [https://zenodo.org], FigShare [https://figshare.com] ou Dryad [https://datadryad.org/]

Fontes: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020). Disponível online na Plataforma NAU.

Furtado, Filipe, Príncipe, Pedro, Carvalho, José, Kit sobre dados de investigação RCAAP (2017). Disponível em http://hdl.handle.net/1822/46351 Consultado a 09/07/2021. 

Um número crescente de editores e revistas já dispõe de uma política e requisitos específicos para dados científicos que fundamentam os resultados submetidos para publicação. Algumas publicações exigem mesmo a partilha de dados como condição para aceitação dos artigos, cumprindo o procedimento seguinte: envio de dados, depósito em repositório ou na cloud do editor, informação para contacto.

Não é recomendado o depósito de dados na cloud do editor, por razões de ética e salvaguarda a longo prazo. Além de que:

Publishers shouldn’t be determining where authors deposit their data. It should be the researchers (and their funder) that decide the best location for data deposit. This approach gives tremendous control to these publishers to set the bar for repository compliance. Over time, if we cede the control to those publishers, this could (and probably will) lead to only well-resourced repositories being available to authors that publish in those journals.

(https://www.coar-repositories.org/news-updates/input-to-data-repository-selection-criteria-that-matter/)


Políticas de dados de editoras internacionais:

Elsevier: https://www.elsevier.com/authors/tools-and-resources/research-data

PLOS: https://plos.org/open-science/open-data/

SAGE: https://uk.sagepub.com/en-gb/eur/research-data-sharing-policies

SPRINGER: https://support.springer.com/en/support/solutions/folders/6000238326

Taylor & Francis: https://authorservices.taylorandfrancis.com/data-sharing-policies/

Wiley: https://authorservices.wiley.com/open-research/open-data/index.html


Política de dados da Open Research Europe, a plataforma de publicação científica da Comissão Europeia, lançada em 2020-2021

 – https://open-research-europe.ec.europa.eu/for-authors/data-guidelines

 – https://openreseurope.s3.amazonaws.com/resources/ORE-publishing-policies.pdf

 

No Horizonte 2020, foram estabelecidos requisitos que visam melhorar e maximizar o acesso e a reutilização dos dados de investigação gerados por projetos financiados pela Comissão Europeia. Entre 2014 e 2016 foi desenvolvido um projeto-piloto, mas entre 2017-2020 passou a ser prática padrão para todos os financiamentos no âmbito deste quadro de financiamento.

Os requisitos de acesso aberto estão descritos no artigo 29 do H2020 Programme AGA – Annotated Model Grant Agreement. No que diz respeito aos dados:

  • partilhar os dados que validem os resultados apresentados em publicações científicas, bem como outros dados, conforme especificado no plano de gestão de dados;
  • apresentar um Plano de Gestão de Dados nos primeiros 6 meses do projeto e atualizá-lo ao longo do projeto, sempre que houver alterações;
  • depositar os dados num repositório seguro e certificado assim que possível. O repositório Zenodo é adequado para este efeito;
  • atribuição de uma licença CC BY ou equivalente;
  • garantir a descrição dos dados e informação sobre resultados e ferramentas para o seu reuso ou validação.
  • o acesso aos dados deve ser aberto, com exceção de casos de interesse legítimo, segurança, privacidade, propriedade intelectual, de acordo com o princípio “as open as possible, as closed as necessary”.

Saber mais:
H2020 Programme AGA – Annotated Model Grant Agreement http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf. Consultado em 09/07/2021.

Guidelines on Open Access and Research Data in Horizon 2020
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf.Consultado em 09/07/2021.

H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf. Consultado em 09/07/2021.

Practical Guide to the International Alignment of Research Data Management – Extended Edition
https://www.scienceeurope.org/our-resources/practical-guide-to-the-international-alignment-of-research-data-management/. Consultado em 09/07/2021.

“Open Science will become the new modus operandi in Horizon Europe”

Tal como descrito no artigo 17 do Horizon Europe Model Grant Agreement, a gestão FAIR dos dados da investigação é uma prática mandatória nos projetos financiados. Para cumprir com o estipulado pelo Horizonte Europa os/as beneficiários/as de financiamento devem:

  • apresentar um Plano de Gestão de Dados nos primeiros 6 meses do projeto e atualizá-lo ao longo do projeto, sempre que houver alterações;
  • assegurar a gestão responsável dos dados, segundo os princípios FAIR – Findable, Accessible, Interoperable, Reusable;
    depositar os dados num repositório seguro e certificado assim que possível. O repositório Zenodo é adequado para este efeito;
  • atribuição de uma licença CC BY ou equivalente;
  • garantir a descrição dos dados e informação sobre resultados e ferramentas para o seu reuso ou validação.
  • o acesso aos dados deve ser aberto, com exceção de casos de interesse legítimo, segurança, privacidade, propriedade intelectual, de acordo com o princípio “as open as possible, as closed as necessary”,
  • assegurar a referência à agência de financiamento e código de financiamento de acordo com as especificações estipuladas pelo HE.
  • assegurar que os metadados estão completos, incluindo informação sobre licenças e identificadores persistentes.

Saber mais:
Horizon Europe Programme Guide, pp. 38 e ss. https://ec.europa.eu/info/funding-tenders/opportunities/docs/2021-2027/horizon/guidance/programme-guide_horizon_en.pdf. Consultado em 29/04/2021.

Model grant agreement (MGA), Art.º 17 – Communication, dissemination, open science and visibility, pp. 107-09. https://ec.europa.eu/info/funding-tenders/opportunities/docs/2021-2027/common/agr-contr/general-mga_horizon-euratom_en.pdf.Consultado em 29/04/2021.

Horizon Europe Regulation, Art.º 39. https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32021R0695&from=EN. Consultado em 29/04/2021.