PatentService Stahlberg

Recherche | Analyse | Report

»Demo«-Patentstatistik zu Erfindungen im Bereich pharmazeutische Zubereitungen

Auf dieser Seite wird ein umfassender Patentdatensatz analysiert, der sich auf Erfindungen im Bereich der pharmazeutischen Zubereitungen bezieht. Die Patentdaten werden gemäß der chemischen Verbindungsklassen analysiert, die in den Erfindungen beschrieben werden, und es wird der zeitliche Verlauf der Anmeldeaktivitäten untersucht. Dazu werden die den Erfindungen zugewiesenen Patentklassifikationen in die Gruppe A61K 31/00 verwendet, die sich auf organische Wirkstoffgruppen beziehen. Die Wirkstoffe finden Anwendung beispielsweise in Medikamenten und Arzneimitteln.

Mit den Patentdaten werden Patent-Heatmaps erzeugt und verschiedene Möglichkeiten dieser Visualisierungsform aufgezeigt. Es wurde ein umfangreicher pharmazeutischer Patentdatensatz gewählt, um beispielsweise eine monatliche Darstellung und thematische Filterung der Daten zu demonstrieren.

Die Heatmaps stellen die Häufigkeit der Klassifikationen in die IPC/CPC-Hauptgruppe A61K 31/00 und in ihre Untergruppen über die Zeit und die verschiedenen Gruppen dar. In die IPC/CPC-Hauptgruppe A61K 31/00 und ihre Untergruppen werden Erfindungen klassifiziert, die pharmazeutische Zubereitungen beschreiben, die durch organische Wirkstoffe gekennzeichnet sind.

Die Abfrage

ipc or cpc = A61K0031 and prdo >= 20150101

im Global Patent Index (GPI) ergab am 26.12.2020 genau 311.598 Treffer, die sich 128.995 Patentfamilien beziehungsweise Erfindungen zuordnen ließen, die ab Januar 2015 erstmalig zum Patent angemeldet wurden.

Ein Überblick über die Daten

In der folgenden Abbildung 1 sind die gesamten Klassifikationsdaten der gefundenen Erfindungen als Häufigkeitsverteilung dargestellt, wobei die Spalten die verschiedenen Gruppen repräsentieren und die Zeilen die ermittelten frühesten Anmeldemonate der Erfindungen von Januar 2015 bis Dezember 2020. Die Häufigkeiten sind entsprechend der Farbskala rechts farbcodiert.

In der Abbildung sind zwei Abschnitte gelb beziehungsweise rot eingerahmt. Der gelb markierte Bereich der Daten wird in einer vergrößerten Darstellung weiter unten als interaktive Grafik vorgestellt, der sich rechts oben befindende rot markierte Bereich wird auf andere Weise untersucht.

Im gelb markierten Bereich befindet sich das absolute Maximum der Verteilung, das für Dezember 2016 genau 389 früheste Patentanmeldungen anzeigt, die in die Untergruppe A61K 31/045 klassifiziert sind. Diese Untergruppe betrifft Hydroxyverbindungen, beispielsweise Alkohole, beziehungsweise deren Salze, beispielsweise Alkoholate.

In der Übersicht der Abbildung 1 können horizontale Linien erhöhter Aktivität erkannt werden, die neben anderen Monaten insbesondere den Monat Dezember kennzeichnen. Senkrechte Linien erhöhter Aktivität kennzeichnen Verbindungsklassen mit vermehrtem Aufkommen in den Anmeldungen des untersuchten technischen Gebiets. Außerdem kann ein »Ausdünnen« der Daten ab etwa Juli 2019 erkannt werden. Dieses Datum liegt etwa 18 Monate vor dem Zeitpunkt der Datenerhebung und markiert den Bereich, in dem die übliche Geheimhaltungszeit von Patentanmeldungen noch nicht verstrichen war.

Heatmap der Verteilung vergebener Untergruppen in der Hauptgruppe A61K31/00 - medizinische Zubereitungen, die organische Wirkstoffe enthalten

Im rot markierten Bereich sind die Untergruppen einiger interessanter Verbindungsklassen angeordnet, die aktuell eine hohe - auch mediale - Beachtung finden. Dazu gehören unter anderem Ribo- und Desoxyribonucleinsäuren (RNA, DNA) und deren Bausteine. Dieser Bereich wird später untersucht, im Folgenden soll zunächst der gelbe Bereich mit einer interaktiven Grafik dargestellt werden.

Anzumerken ist, dass Impfstoffe - auch Krebs-Impfstoffe - nicht in die Gruppe A61K 31/00 klassifiziert werden.

Heatmap-Ausschnitt mit Maximalwert

In der unten abgebildeten Grafik 1 ist der oben in Abbildung 1 gelb markierte Bereich als interaktive Heatmap dargestellt. Beim »Surfen« in der Heatmap werden verschiedene Daten wie die Zahl der Erfindungen (abs. Häufigkeit), die im ausgewählten Anmeldemonat in die ausgewählte Gruppe klassifiziert wurden, die relative Häufigkeit als Bezug zum Maximalwert, der Titel der Gruppe und eine die Verbindungsklassen beschreibende chemische Strukturformel in einem Tooltip angezeigt.

Wie schon in der Übersicht der Abbildung 1 kann auch in der Grafik 1 erkannt werden, dass im Dezember eine leicht erhöhte Anmeldeaktivität zu verzeichnen ist. Die Hydroxyverbindungen charakterisierende 045er-Untergruppe ist links als farbintensives Band zu erkennen, das auch den Maximalwert umfasst. Andere senkrecht verlaufende Bänder weisen auf andere Verbindungsklassen mit höherer Aktivität hin. Nicht selten sind Datenpunkte mit relativen Häufigkeiten von mehr als 30 % auszumachen, auch Werte von 40 bis etwa 60 % sind im kleinen Ausschnitt der gesamten Daten zu erkennen.

Berücksichtigt man die relativ starken Schwankungen der den Maximalwert aufweisenden 045er-Untergruppe, zeigt schon der vorliegende Ausschnitt, dass die Anmeldeaktivität in mehreren technologischen Bereichen, also für mehrere Verbindungsklassen, sehr intensiv ist. Deshalb liegt auch die Vermutung nahe, dass die 045er-Untergruppe nicht in jedem Monat den monatsbezogenen Maximalwert innehaben muss. Das ist im Ausschnitt der Grafik 1 auch tatsächlich der Fall, aber relativ schwer zu sehen. Weiter unten wird eine andere Darstellungsform beschrieben, die wechselnde technologische Schwerpunkte besser sichtbar macht.

Die in den Tooltips angezeigten Gruppen-Titel sind CPC-Titel, die zumeist mit den entsprechenden IPC-Titeln identisch sind. Die in manchen Titeln eingefügten CPC-Ergänzungen zu den entsprechenden IPC-Titeln sind in geschweifte Klammern eingeschlossen und zeigen damit Unterschiede zwischen IPC und CPC an. Die Strukturformeln wiederum sind Teil der IPC-Titel-Definitionen, die von der WIPO gepflegt werden.

Die in den Tooltips angezeigten Gruppen-Titel zeigen den kompletten Titel der jeweiligen Gruppe an - mit einer Ausnahme: Aufgrund der teilweise sehr langen vollständigen Titel wurde in den Tooltips darauf verzichtet, jeweils die oberste Hierarchieebene, die Hauptgruppe A61K 31/00 mit aufzuführen. Da die Hierarchie innerhalb der Untergruppen durch ein Punktesystem angezeigt wird, fehlt deshalb in den Tooltips in allen Hierarchieebenen ein Punkt im Vergleich zu den Klassifikations-Nachschlagewerken der Patentbehörden.

Inklusive Hauptgruppe sind die Daten 397 verschiedenen Gruppen zugeordnet, von denen eine Untergruppe (A61K 31/5545) nur in der CPC definiert ist. Die Werte für die Hauptgruppe werden ganz links in der Grafik angezeigt. Wie Untergruppen hierarchisch voneinander und von der Hauptgruppe abhängig sind, wird hier erklärt.

Analyse des zweiten Heatmap-Ausschnitts

In der Abbildung 1 oben ist ein Ausschnitt rot eingerahmt. Dieser soll nun näher betrachtet werden. Der entsprechende Ausschnitt wird in den Abbildungen 2a und 2b zweimal dargestellt. Beiden Abbildungen liegen dieselben Daten zugrunde. Für die Abbildung 2b wurden zusätzliche Daten berechnet, um weitere Sachverhalte darstellen zu können. Das Ergebnis ist eine andere Farbcodierung und eine andere Aussage.

In Abbildung 2a ist die Farbgebung identisch mit der von Abbildung 1, die eine Heatmap beziehungsweise Häufigkeitsverteilung mit einem absoluten Maximum darstellt. In Abbildung 2b liegt eine zeitintervallbezogene Farbgebung vor. Diese Form der Farbgebung wird hier genauer erklärt.

Kurz gesagt ist in der Abbildung 2b für jedes Zeitintervall - also für jeden Monat - der Maximalwert bestimmt worden, und jedem Datenpunkt des Zeitintervalls eine Farbcodierung zugewiesen worden, die dem Verhältnis des Datenpunktwerts zum Maximalwert des Zeitintervalls entspricht. Deshalb liegt in Abbildung 2b auch ein völlig anderes Diagramm, auf Grundlage derselben Daten, vor, in dem für jedes Zeitintervall die Intensität einer Technologie (einer Verbindungsklasse) innerhalb eines Zeitintervalls besser abgelesen werden kann. Die Abbildung 2b stellt gewissermaßen einen »Stapel« von monatlichen Häufigkeitsverteilungen dar.

An der x-Achse sind einige Spalten, die verschiedene Verbindungsklassen repräsentieren, mit Beschriftungen versehen worden.

Ausschnitt der Heatmap der Verteilung vergebener Untergruppen in der Hauptgruppe A61K31/00 - pharmazeutische Zubereitungen, die organische Wirkstoffe enthalten

Dabei stehen die Beschriftungen für folgende Verbindungsklassen:

  • Z: Kohlenhydrate; Zucker; Derivate davon (alle folgenden Gruppen der Abb. 2a und 2b gehören hierarchisch zu Z)
  • SC: Verbindungen mit Saccharidradikalen, die über Glycosidbindungen an ein kondensiertes carbocyclisches Ringsystem gebunden sind
  • SH: Verbindungen, die ein Saccharidradikal und einen heterocyclischen Ring mit Sauerstoff als Ring-Heteroatom aufweisen
  • 3: Verbindungen mit drei oder mehr Nucleosiden oder Nucleotiden
  • N: natürliche Ribonucleinsäuren (RNA)
  • DS: doppelsträngige Nucleinsäuren oder Oligonucleotide

Wie in Abbildung 2a zu erkennen, weisen einige der markierten Spalten eine erhöhte Intensität auf, die relativen Häufigkeiten liegen oft bei 10 bis 30 % des Maximalwerts von 389, der im Dezember 2016 in der Untergruppe A61K 31/045 (Alkohole usw.) verzeichnet wurde.

In der Abbildung 2b werden die zeitintervallbezogenen Häufigkeiten des gewählten Ausschnitts dargestellt. Dabei zeigen die Intensitäten für SC und SH häufig monatliche Häufigkeitswerte von 30 bis 50 %, auch darüber liegende Werte treten auf. Die Intensitäten der Kategorien 3, N und DS betragen oft über 30 %, auch Werte größer 40 beziehungsweise 50 % sind zu finden. Diese Verbindungsklassen weisen also im angezeigten Zeitraum eine erhebliche Anmeldeaktivität auf.

Bemerkenswert ist bei Betrachtung der Abbildungen 2a und 2b noch, dass direkt rechts von der Verbindungsklasse SH die Untergruppe A61K 31/7052 angeordnet ist, die Verbindungen, die ein Saccharidradikal und einen heterocyclischen Ring mit Stickstoff als Ring-Heteroatom aufweisen, betrifft. Zu dieser Verbindungsklasse gehören beispielsweise auch Nucleoside und Nucleotide. Hier beginnt also eine Reihe von insgesamt 16 Gruppen, die DNA, RNA beziehungsweise deren Bausteine, inklusive modifizierter Bausteine, betreffen. Die Verbindungsklasse natürliche DNA, die direkt rechts der Kategorie N angeordnet ist, weist durchweg eine geringe Intensität auf.

Daten, die auf eine therapeutische Aktivität hinweisen

Die hier visualisierten Daten betreffen Erfindungen, die pharmazeutische Zubereitungen beschreiben, die durch organische Wirkstoffe gekennzeichnet sind (A61K 31/00). Da die zugrunde liegenden Patentdaten alle Klassifikationen der Erfindungen umfassen, lassen sie sich filtern.

In die Unterklasse A61P werden Erfindungen klassifiziert, die eine »spezifische therapeutische Aktivität von chemischen Verbindungen oder medizinischen Zubereitungen« beschreiben. Dabei werden die Erfindungen in jede passende Untergruppe von A61P klassifiziert, denn chemische Verbindungen oder medizinische Zubereitungen können Wirksamkeit bei verschiedenen Erkrankungen oder Störungen aufweisen.

Im Folgenden werden Heatmap-Ausschnitte vorgestellt, in denen die Daten der oben vorgestellten Gruppe A61K 31/00 nach zwei ausgewählten Gruppen von Krankheitsbildern beziehungsweise Störungen, die in A61P klassifiziert sind, gefiltert werden. Damit werden Datensätze visualisiert, die sowohl in A61K 31/00, als auch in A61P klassifiziert sind.

In die Hauptgruppe A61P 35/00 und ihre Untergruppen sind Erfindungen klassifiziert, deren Erfindungsgegenstand eine therapeutische Aktivität gegenüber »Neoplasien«, d. h. Neubildungen von Gewebe aufweist. Darunter werden hier Tumore verstanden. Von den 311.598 Dokumenten des Datensatzes sind 75.321 Dokumente auch in die Gruppe A61P 35/00 klassifiziert, beziehungsweise 18.061 Erfindungen.

Die Abbildungen 3a und 3b zeigen für die Erfindungen, die sowohl in A61K 31/00, als auch in A61P 35/00 beziehungsweise in deren Untergruppen klassifiziert sind, die Häufigkeiten der verschiedenen Verbindungsklassen als Repräsentationen der A61K 31-Untergruppen an. Damit wird die Anmeldeaktivität von Erfindungen dargestellt, die pharmazeutische Zubereitungen betreffen, die (unter anderem) durch organische Wirkstoffe gekennzeichnet sind und eine therapeutische Aktivität gegenüber Neubildungen von Gewebe haben.

In Abbildung 3a zeigt sich eine hohe Intensität in der Verbindungsklasse SC. Diese Verbindungsklasse weist mit 56 angemeldeten Erfindungen innerhalb eines Monats auch den Maximalwert des auf »Krebsmedikamente« eingeschränkten Datensatzes auf. Auch einige der »DNA/RNA«-Verbindungsklassen zeichnen sich durch eine höhere Intensität aus als in der Grundgesamtheit der Daten, die in den Abbildungen 2a und 2b dargestellt ist.

Ausschnitt der Heatmap der Verteilung vergebener Untergruppen in der Hauptgruppe A61K31/00 - pharmazeutische Zubereitungen, die organische Wirkstoffe enthalten

Abbildung 3b macht sichtbar, dass die Verbindungsklasse SC ab Mai 2018 fast immer den monatlichen Maximalwert erreicht. Dass die Verbindungsklasse SC eine hohe Anmeldeaktivität auszeichnet, ist schon in Abbildung 3a zu beobachten. Das Erreichen eines zeitintervallbezogenen Maximalwerts für diese Verbindungsklasse ist aus Heatmaps mit einem Maximalwert, wie ausschnittsweise in Abbildung 3a dargestellt, allerdings nur schwer festzustellen. Dafür müssen für einzelne Intervalle Werte ausgelesen und Berechnungen angestellt werden. Abbildung 3b ist das Ergebnis solcher Berechnungen und kann Veränderungen von Anmeldeaktivitäten deutlicher hervorheben als eine Heatmap mit einem Maximum.

Darum könnte versucht werden, diese Form der Datenaufbereitung als visuellen Alert oder visuelles Monitoring einzusetzen.

In den Monaten, in denen in Abbildung 3b kein Maximum für die Verbindungsklasse SC angezeigt wird, liegt das Maximum der zeitintervallbezogenen Verteilung auf einer anderen Verbindungsklasse - oder auch bei mehreren anderen Verbindungsklassen. Die Abbildung 3b zeigt also mit der Zeit wechselnde technologische Schwerpunkte im Bereich der Erfindungen an, die pharmazeutische Zubereitungen betreffen, die durch organische Wirkstoffe gekennzeichnet sind und auf eine therapeutische Aktivität gegenüber Neubildungen von Gewebe abzielen.

Antiinfektiöse Mittel

In die Hauptgruppe A61P 31/00 und ihre Untergruppen sind Erfindungen klassifiziert, die chemische Verbindungen oder medizinische Zubereitungen beschreiben, die antiinfektiös sind und beispielsweise zur Gruppe der Antibiotika, Antiseptika oder Chemotherapeutika zählen. Diese Gruppe umfasst Mittel, die eine therapeutische Aktivität gegenüber Bakterien, Viren und beispielsweise Pilze aufweisen.

Die Frage, ob in diese Gruppe auch »Krebsmedikamente« klassifiziert werden, können Mediziner, Pharmazeuten und andere Fachleute beantworten.

Von den 311.598 Dokumenten des hier untersuchten Datensatzes sind 32.335 Dokumente auch in die Gruppe A61P 31/00 klassifiziert, beziehungsweise 9.234 Erfindungen.

In der Abbildung 4a zeigt sich eine eher moderate Intensität. In der die monatlichen Häufigkeiten anzeigenden Abbildung 4b wird deutlich, dass in einigen Anmeldemonaten starke Intensitäten zu verzeichnen sind. Dabei kann es sich auch um Monate mit geringer Aktivität handeln.

Interessant ist, dass im Bereich der »DNA/RNA«-Verbindungsklassen von SH bis DS in 2017 und Anfang 2019 über fast die gesamte Breite des Bereichs erhöhte Intensitäten zu erkennen sind.

Auch links der Verbindungsklasse Z zeigt eine Spalte, wie schon in anderen Abbildungen, erhöhte Intensität. Dabei handelt es sich um eine Verbindungsklasse, die sich auf phosphororganische Verbindungen bezieht. Links der Spalte Z finden sich in den Abbildungen, außer einer Verbindungsklasse für bororganische Verbindungen und einer für siliciumorganische Verbindungen, nur phosphororganische Verbindungsklassen.

Ausschnitt der Heatmap der Verteilung vergebener Untergruppen in der Hauptgruppe A61K31/00 - pharmazeutische Zubereitungen, die organische Wirkstoffe enthalten

Schlussbemerkungen zum Thema

Wichtig für das Verständnis dieser Patentdaten sind unter anderem zwei Dinge:

  1. gemäß CPC-Definition der Gruppe A61K 31/00 werden - im Gegensatz zur IPC - für neue Verbindungen, d. h. für Verbindungen, die an sich beansprucht werden und in die Unterklassen C07C bis C07J zu klassifizieren sind, keine A61K 31/00-Symbole vergeben, selbst nicht, wenn weitere Ansprüche einen Bezug zu medizinischen Verwendungen der Verbindungen enthalten. Wenn allerdings die Erfindung medizinische Zubereitungen offenbart, die besagte neuen Verbindungen in Abmischung mit weiteren Wirkstoffen enthalten, dann wird die neue Verbindung in A61K 31/00 klassifiziert und es werden weitere Klassifizierungen vorgenommen. Mehr dazu beispielsweise in den Klassifikations-Nachschlagewerken der Patentbehörden.
  2. In Abbildung 4b ist für den August 2020 ein sehr »intensiver« roter Datenpunkt zu erkennen. Tatsächlich wurde in dem den Abbildungen 4a und 4b zugrunde liegenden Datensatz genau eine Erfindung für diesen Datenpunkt gezählt. Es können also in zeitintervallbezogenen, gestapelten Häufigkeitsverteilungen auch kleine Datenmengen zu einem »Maximalausschlag« führen. Ein Weg, das anzuzeigen, ist die Anzeige des Häufigkeitswerts in einem Tooltip.

In die Unterklassen C07C bis C07J werden »gewissermaßen« alle organischen Verbindungsklassen klassifiziert - außer Peptide -, die in C07K einzuordnen sind - und makromolekulare Verbindungen. Natürlich ist es auch möglich, Erfindungen, die sowohl in die Unterklassen C07C bis C07J, als auch in die Gruppen der Unterklasse A61P klassifiziert sind, zu analysieren, um eine andere Visualisierung von zeitlichen und technologischen Trends von Patentanmeldungs-Aktivitäten, die auf eine spezifische therapeutische Aktivität von chemischen Verbindungen oder medizinischen Zubereitungen hinweisen, zu erzeugen. Dafür ist der hier verwendete Datensatz mit »A61K 31/00-Erfindungen« allerdings nicht geeignet.

Anstatt alle Daten eines Zeitabschnitts und einer bestimmten Fragestellung in solchen Heatmaps abzubilden, können auch die Daten eines einzelnen Anmelders, beispielsweise eines Wettbewerbers, visualisiert werden, um das zeitliche Anmeldeverhalten, technologische Schwerpunkte und mögliche wechselnde Schwerpunktsetzungen dieses Anmelders anzuzeigen. Außerdem können die Daten zweier Anmelder in zwei Heatmaps nebeneinander gestellt werden, um die Anmelder miteinander zu vergleichen. Der Vergleich gelingt aber auch in einer einzigen Heatmap - mit anderer Farbcodierung - wie hier beispielhaft vorgestellt.

Angaben zum Inhalt der Grafik 1

Die Grafik verwendet urheberrechtlich geschütztes Material in Form von Klassifikationstiteln beziehungsweise chemischen Strukturformeln.

  • Die in der Grafik angezeigten Gruppen-Titel sind CPC-Titel. Die in manchen Titeln eingefügten CPC-Ergänzungen zu den entsprechenden IPC-Titeln sind in geschweifte Klammern eingeschlossen und zeigen damit Unterschiede zwischen IPC und CPC an
  • Die CPC-Titel sind von der Website https://data.epo.org/linked-data/sparql.html übernommen worden
  • der Link zur Datenquelle
  • Die Startseite von Linked Open EP Data findet sich hier
  • Das Recht zur Nutzung der Daten in Linked Open EP Data gewährt das EPA (Europäisches Patentamt) - Lizenz: CC BY 4.0
  • Haftungsausschluss für Linked Open EP Data: Haftungsausschluss (Registerkarte »Bedingungen«)
  • Lizenz: CC BY 4.0 Creative Commons Namensnennung 4.0 International
  • Details zur Lizenz: Details der Lizenz
  • Das Recht zur Nutzung der IPC-Daten gewährt die WIPO (World Intellectual Property Organization)
  • Haftungsausschluss der WIPO für die zur Verfügung gestellten Daten: Haftungsausschluss
  • Lizenz: CC BY 3.0 IGO Creative Commons Namensnennung 3.0 IGO
  • Details zur Lizenz: Details der Lizenz
  • Die chemischen Strukturformeln, die den Definitionen der Untergruppen zugeordnet sind, sind von der Website der WIPO übernommen worden und sind Teil der IPC-Titel-Definitionen.
  • Die chemischen Strukturformeln sind wie folgt verändert worden: Wenn eine IPC-Definition mehrere Strukturformeln umfasst, sind die Strukturformeln in eine Grafik zusammengefasst und durch eine gestrichelte Linie getrennt. Wenn keine Abbildung vorhanden ist, wird der Text »keine Abbildung vorhanden« angezeigt.
  • Die CPC-Titel sind so verändert worden, dass immer - wenn es nicht übersehen wurde - die vollständige Hierarchie der Untergruppe angezeigt wird, mit einer Ausnahme: die oberste Hierarchieebene, die Hauptgruppe A61K 31/00,wird in der Hierarchie nicht abgebildet. Deshalb fehlt in den Tooltips in allen Hierarchieebenen ein Punkt im Vergleich zum CPC-Klassifikations-Nachschlagewerk des Europäischen Patentamts

Wichtiger Hinweis:

Es wird darauf hingewiesen, dass keine Garantie für die Qualität des Inhalts der »Demo«-Statistiken übernommen wird. Die Daten kommen aus Quellen, die keine Haftung für die Vollständigkeit und Richtigkeit der Daten übernehmen. Die Daten sind verarbeitet worden und trotz Sorgfalt und Plausibilitätsprüfungen können Fehler entstanden und unentdeckt geblieben sein. Wer aus den hier vorgelegten »Demo«-Statistiken Handlungen ableitet, der muss selbst dafür Verantwortung tragen.