Breveter pour lutter contre les pandémies : Annexes

 

Annexe A – Méthodologie

Dans le présent rapport, l'expression « invention brevetée » fait référence aux familles de brevets. Une famille de brevets est un ensemble de demandes de brevets similaires déposées auprès de plusieurs instances. Bien qu'il existe plusieurs types de familles de brevets, celle prise en compte dans le présent rapport est la famille de brevets étendue du Centre international de documentation de brevets, qui est développée et maintenue par l'Office européen des brevets. Le brevet le plus ancien déposé dans chaque famille de brevets est appelé demande de brevet prioritaire. Les demandes prioritaires déposées entre 1999 et 2018 ont été prises en compte aux fins de cette analyse.

Les inventions brevetées sont classées à l'aide d'un ensemble de codes de la Classification internationale des brevets (CIB) et de la Classification coopérative des brevets (CPC) sur la base des domaines technologiques auxquels elles se rapportent. Afin d'obtenir l'ensemble de données pour cette analyse, les conseillers en brevets du CNRC ont été en mesure de dresser une liste de la CIB, de la CPC et de mots-clés relatifs aux technologies d'atténuation des pandémies à partir de la stratégie de recherche de brevets. Afin de limiter le nombre d'enregistrements faussement positifs saisis à partir de certains larges codes de la CIB et de la CPC, ces codes ont été utilisés conjointement à un ensemble de mots-clés. Cette stratégie de recherche de brevets a été interrogée dans une base de données de brevets gérée par Clarivate Analytics et connue sous le nom de Derwent InnovationNote de bas de page ix.

En outre, une petite partie de l'ensemble de données a été constituée à partir des numéros de séquence des protéines et a été extraite à l'aide de la base de données Orbit Intelligence de QuestelNote de bas de page x. Au cours de notre analyse, nous avons constaté que ces inventions brevetées étaient technologiquement similaires aux inventions brevetées dans le domaine de la recherche sur le développement de thérapies et de vaccins. En conséquence, ces inventions brevetées ont été ajoutées en tant que sous-catégorie sous la rubrique « Développement de thérapies et de vaccins » portant le nom de « Séquence de protéines ».

Il est important de noter que la stratégie de recherche de brevets élaborée pour le présent rapport est fortement axée sur les trois domaines de recherche décrits dans le Programme Défi en réponse à la pandémie du CNRC et peut ne pas être complètement représentative des technologies d'atténuation des pandémies. Pour obtenir une copie de la stratégie complète de recherche de brevets ainsi qu'une liste des numéros de publication pris en compte pour cette analyse, veuillez communiquer avec cipo-ipresearch-opic-recherchepi@ised-isde.gc.ca.

Annexe B – Nettoyage des données

Afin de tenir compte des incohérences de la convention d'appellation et des fautes d'orthographe qui sont couramment rencontrées dans tout ensemble de données sur la PI, l'OPIC consacre beaucoup de temps à vérifier que l'ensemble de données sous-jacent présente le moins d'incohérences possibles.

Notre équipe de science des données a exploité les techniques d'apprentissage machine dans son script Python pour normaliser les données. L'un des attributs intégrés au modèle d'apprentissage machine comprend une mesure de comparaison de chaînes de caractères connue sous le nom de distance de Jaro-Winkler, qui mesure les similitudes entre deux noms d'entités. Un autre attribut pris en compte est la différence entre les dates de dépôt des inventions brevetées portant les deux noms d'entités pris en compte. Enfin, le modèle d'apprentissage machine prend également en considération le nombre d'entités communes entre les deux entités examinées. À l'heure actuelle, un modèle Random Forest qui produit une précision allant jusqu'à 98 % a été déployé. En utilisant cette méthode, le nom d'entité ayant le plus de renseignements remplacera les autres noms d'entités similaires dans l'ensemble de données.

Annexe C – Indice de concentration de la PI

L'ICPI utilisé dans ce rapport découle d'un long historique d'indices de concentration appliqués dans de nombreuses disciplines, comme l'indice Herfindahl-Hirschman, l'indice de Simpson, l'indice de Shannon et l'indice de nombre effectif de partis. La formule utilisée pour calculer l'indice de concentration de la propriété intellectuelle (ICPI) est la suivante :

ICPI = S 1 2 + S 2 2 + S 3 2 + + S n 2

sn est la part des brevets d'invention détenus par le participant n, en fraction.

La valeur de l'indice se situe entre 1/n et 1. Des valeurs d'indice plus proches de 0 indiqueraient qu'une industrie ou un domaine technologique présente un environnement plus compétitif, composé d'un grand nombre de participants moins actifs. Des valeurs d'indice comprises entre 0,15 et 0,25 supposent une concentration modérée, tandis que des valeurs d'indice supérieures à 0,25 indiquent qu'un domaine technologique présente un environnement fortement concentré, composé de quelques acteurs dominants. L'indice peut être utilisé pour mesurer la concentration au niveau mondial parmi les principaux pays ou au sein d'un pays pour voir la concurrence entre les entreprises de ce pays.

Annexe D – Indice de spécialisation relative

L'indice de spécialisation relative (ISR) est utilisé pour mieux comprendre les atouts d'un pays dans un domaine technologique ou un secteur de l'industrie particulier. Plus précisément, il compare la proportion des inventions brevetées d'un pays dans un domaine technologique particulier à la proportion de toutes les inventions brevetées de ce pays par rapport à toutes les inventions brevetées dans le monde.

La formule utilisée pour calculer cet indice pour un pays donné est la suivante :

ISR pays = log 10 [  1999 2018 P Pays , TAP  1999 2018 p Monde , TAP (  1999 2018 p Pays  1999 2018 P Monde ) ]
 

où P représente les inventions brevetées et TAP signifie Technologies d'Atténuation des Pandémies.

Numérateur

Le nombre total de brevets d'invention attribués aux demandeurs d'un pays donné pour un domaine technologique donné est divisé par le nombre total de brevets déposés dans le monde entier pour ce domaine technologique.

Dénominateur

Le nombre total de brevets d'invention attribués aux demandeurs d'un pays donné est divisé par le nombre total de brevets déposés dans le monde entier dans tous les domaines technologiques.