Negex Negationserkennung für deutsche klinische Texte

Deutsches NegEx Trigger-Set: Unser Trigger-Set ist in unserer Publikation zu BioTxtM 2016 beschrieben (siehe Artikel unten). Es kann in Kombination mit NegEx verwendet werden, um Negationen und Spekulationen (vage Beschreibungen) in deutschen klinischen Texten zu erkennen. Das Trigger-Set wurde von einem deutschen Muttersprachler, basierend auf dem Trigger-Set multilingual_lexicon-en-de-fr-sv.csv, erstellt, welches hier eingesehen werden kann (siehe medinfo_2013_multilingual_negex_lexicon_v1_April30th2013.zip).

Folgende Schritte wurden durchgeführt:

  • Originale ConText-Terme wurden ausgewählt.
  • Übersetzungen sowie alternative Übersetzungen wurden überprüft und zum Teil korrigiert.
  • Neue, alternative Übersetzungen wurden hinzugefügt.
  • Reguläre Ausdrücke wurden erweitert.
  • Der Skopus (von Negationen) wurde unter Einbezug von GE Action, Category und eigener Überlegungen ermittelt. In vielen Fällen wurden "umschließende" Trigger, die sogenannten Partikelverben, wie "lehnt ... ab" und "wies ... zurück", gekürzt und nur zum Teil in die Sammlung übernommen.

Download: negex_trigger_german_biotxtm_2016.txt

Hinweis: Vor der Nutzung des Trigger-Sets müssen die folgenden zwei Änderungen an negex.python.zip vorgenommen werden (7.7.2009). Ersetzen Sie die Zeile:

pattern = r'\b(' + trig + r')\b'

durch:

if trig == "\?":
   pattern = r'(' + trig + r')'
else:
   pattern = r'\b(' + trig + r')\b'

und die Zeile:

sb3 = sb3 + ' ' + sentenceTokens[i]

durch:

sb3.append(sentenceTokens[i])

Wir würden uns freuen, wenn Sie unsere Arbeit zitieren :-)

Negation Detection in Clinical Reports Written in German, Viviana Cotik, Roland Roller, Feiyu Xu, Hans Uszkoreit, Klemens Budde and Danilo Schmidt, In Proceedings of the 5th Workshop on Building and Evaluating Resources for Biomedical Text Mining (BioTxtM), 2016, Osaka, Japan [PDF][BibTex]