用語の構成パターン【医療用医薬品添付文書における医療用語の構造と構成要素の解析】

論文紹介

  • 医療用薬品添付文書における医療用語の構造と構成要素の解析
  • 富樫秀夫 et al.
  • 第26回医療情報学連合大会(P17-2)、2006、日本

背景と目的

同一概念の病体について、病名表現が異なるケースが多々ある(例:流行性感冒、流感、風邪様症状)。このような背景から、用語を要素に分解・再編成することで、用語のシソーラス(類語辞書)作成をはかり、機械による判読制度の向上を目指す。

方法

本文中での単語メモ

  • 用語:自立語としての用語文字列
  • 要素:医学的意味を持つ一連の文字列
  • アトム:医学的意味を持つ最小限の文字列

シソーラス化の手順は以下。

  1. 医用文書から用語の抽出
  2. 用語から要素の分離・抽出
  3. 要素の構成パターン解析
  4. 要素の組み合わせで新たな意味を持つ文字列を検出
  5. 用語全体の意味に対する各要素の寄与を検討
  6. 用語のシソーラス化で辞書を作成

結果と考察

要素の構成パターンは多様であったため、定量的な分析は(この時点では)不可能。要素のネスティング(入れ子構造)が存在してくるため、単純な要素数カウントは無意味。

用語の構成パターン(時制接頭語+身体部位+病体根幹表現:急性 胃 炎 など)はいくつか導出されたが、このパターンに当てはまらないものは人的に判断するしかない。

思いつきメモ

用語の構成パターン

…そういえば、修論の研究ではこの項目が抜け落ちてた。学会用に書くときは要追加。

共起性を考えるにあたって

用語の共起性を考える際、この論文で行われているような構成パターンにも着目すると、精度が上がるかも? また、病名がまったく違うものであっても、構成パターンが近いと同じようなインシデントが発生することにつながる、かもしれない。