Format de fichier
La communication officielle du listage des séquences biologiques (LSB) associées à un brevet se fait en format TXT. La structure de fichiers XML est régie par la norme ST.25 relative à la présentation des listages des séquences de nucléotides et d'acides aminés dans les demandes de brevet de l'Organisation mondiale de la propriété intellectuelle (OMPI). L'Office de la propriété intellectuelle du Canada (OPIC) génère deux types de fichiers supplémentaires (PEP et SEQ), qui sont considérés comme des fichiers de travail. Ces fichiers sont parfois incomplets et ne doivent pas être considérés comme étant des communications officielles.
Contenu des fiches et des données
Les fichiers sur les demandes de brevet et sur les brevets délivrés sont inclus. Les données sur les brevets sont mises à la disponibilité du public après une période de confidentialité pouvant aller jusqu'à 18 mois après la première date de dépôt de la demande. Par conséquent, les fichiers de brevets comprennent soit une demande de brevet, soit un brevet ayant déjà été émis ou délivré.
Chaque fichier TXT comprend les types de renseignements suivants sur le brevet délivré ou la demande de brevet :
- Renseignements généraux (noms des demandeurs, titre de l'invention, dates importantes relatives au traitement de la demande)
- Renseignements sur le listage des séquences (numéro d'identification, longueur, type, organisme, caractéristique, nom/clé, lieu)
- Publications spécialisées pertinentes (information sur les publications pertinentes)
Calendrier de production : hebdomadaire et annuelle
Production annuelle
Toutes les semaines, des fichiers TXT, PEP et SEQ sont produits pour toutes les demandes de brevets ou les brevets nouvellement délivrés comprenant une séquence biologique. Ces collections de fichiers nouveaux et mis à jour sont disponibles pour l'année civile en cours. On retrouve donc 52 collections hebdomadaires dont la taille varie entre 1 Mo et 350 Mo, selon le volume d'activité. Chaque collection hebdomadaire comprend un rapport dressant la liste de tous les fichiers de brevets inclus dans l'abrégé de la semaine.
En vertu de la convention d'appellation en vigueur, le nom des fichiers BSL doit contenir le numéro du brevet et la date de production. Chaque dossier devrait contenir au moins un fichier TXT.
Production annuelle
Tous les ans, une collection actualisée complète de fichiers BSL est produite. Les collections annuelles englobent tous les brevets datant de 2003 à la plus récente année civile et sont classées par année.
En date de 2017, la collection de données actualisées sur les brevets comprenait 14 fichiers totalisant environ 4 Go. En vertu de la convention d'appellation en vigueur, le nom des fichiers BSL doit contenir le numéro du brevet et la date de production.