英語版医療機器不具合用語集を対象とした深層学習による機械翻訳の精度評価

医療機器における不具合用語集の国際整合のため,医療機器産業連合会(JFMDA)が作成している医療機器不具合用語集(JFMDA用語集)と国際医療機器規制当局フォーラムが公開している用語集(IMDRF用語集)を効率的にマッピングするためのシステム構築を進めている.本研究では,その第一段階として,深層学習を用いたIMDRF用語集の自動翻訳を実施し,その精度評価を行った.翻訳用モデルとして,sequence-to-sequenceベースの学習済み公開モデルであるmBARTと100言語の翻訳が可能なモデルであるTransformerベースのm2m-100(418Mパラメータモデルと1.2Bパラメータモデ...

Full description

Saved in:
Bibliographic Details
Published in医療情報学 Vol. 42; no. 5; pp. 211 - 215
Main Authors 谷川原, 綾子, 上杉, 正人, 横井, 英人
Format Journal Article
LanguageJapanese
Published 一般社団法人 日本医療情報学会 03.03.2023
Subjects
Online AccessGet full text
ISSN0289-8055
2188-8469
DOI10.14948/jami.42.211

Cover

Abstract 医療機器における不具合用語集の国際整合のため,医療機器産業連合会(JFMDA)が作成している医療機器不具合用語集(JFMDA用語集)と国際医療機器規制当局フォーラムが公開している用語集(IMDRF用語集)を効率的にマッピングするためのシステム構築を進めている.本研究では,その第一段階として,深層学習を用いたIMDRF用語集の自動翻訳を実施し,その精度評価を行った.翻訳用モデルとして,sequence-to-sequenceベースの学習済み公開モデルであるmBARTと100言語の翻訳が可能なモデルであるTransformerベースのm2m-100(418Mパラメータモデルと1.2Bパラメータモデル),Open AIが公開しているGPT-3,Googleが公開しているgoogletransを取得した.加えて,医療機器関連対訳コーパスからオリジナルの翻訳モデル,mBARTと2つのm2m-100をファインチューニングしたモデルも生成した.IMDRF用語集の対訳文からテストデータを抽出し,各モデルにおける翻訳精度を評価したところ,googletransのBLEUスコアが27.3と最も高く,目視評価でも78%と最良の翻訳品質と判定された.GPT-3では,目視評価においてはgoogletransに次ぐ76%であった.mBART50はファインチューニングによりBLEUはわずかに向上したが,目視評価にて品質は低下と判断された.m2m-100は,ファインチューニングしたモデルにてBLEUが低下し,品質も低下した.自作モデルはBLEUが最低となり,目視評価でも最低の品質と判定された.
AbstractList 医療機器における不具合用語集の国際整合のため,医療機器産業連合会(JFMDA)が作成している医療機器不具合用語集(JFMDA用語集)と国際医療機器規制当局フォーラムが公開している用語集(IMDRF用語集)を効率的にマッピングするためのシステム構築を進めている.本研究では,その第一段階として,深層学習を用いたIMDRF用語集の自動翻訳を実施し,その精度評価を行った.翻訳用モデルとして,sequence-to-sequenceベースの学習済み公開モデルであるmBARTと100言語の翻訳が可能なモデルであるTransformerベースのm2m-100(418Mパラメータモデルと1.2Bパラメータモデル),Open AIが公開しているGPT-3,Googleが公開しているgoogletransを取得した.加えて,医療機器関連対訳コーパスからオリジナルの翻訳モデル,mBARTと2つのm2m-100をファインチューニングしたモデルも生成した.IMDRF用語集の対訳文からテストデータを抽出し,各モデルにおける翻訳精度を評価したところ,googletransのBLEUスコアが27.3と最も高く,目視評価でも78%と最良の翻訳品質と判定された.GPT-3では,目視評価においてはgoogletransに次ぐ76%であった.mBART50はファインチューニングによりBLEUはわずかに向上したが,目視評価にて品質は低下と判断された.m2m-100は,ファインチューニングしたモデルにてBLEUが低下し,品質も低下した.自作モデルはBLEUが最低となり,目視評価でも最低の品質と判定された.
Author 谷川原, 綾子
横井, 英人
上杉, 正人
Author_xml – sequence: 1
  fullname: 谷川原, 綾子
  organization: 北海道科学大学 保健医療学部 診療放射線学科
– sequence: 1
  fullname: 上杉, 正人
  organization: 北海道情報大学 医療情報学部 医療情報学科
– sequence: 1
  fullname: 横井, 英人
  organization: 香川大学医学部附属病院 医療情報部
BookMark eNo9UMtKw0AAXETBWnvzN1J3N9lkcyzFFxS86DmsSaopbZW0F48JKJUqSFGkCJaKlFTxET1ULLQfs90m_oUpijDMHOZxmCUwXz2s2gCsIJhFiq7Q1RKrOFkFZzFCcyCFEaUSVVR9HqQgprpEISGLIFOrOXsQQo0gqMAUcOJmGD_eRWcNcT6M2v603xHtYPJ5IU4G4rIRXQWJ-317yv2WeB3FYZd7AfduuNeZDkIRPojnXjRuce-J-w3uN5P69P4tGg_j4IN7L9H7SHz14v71ZNRdBgtFVq7ZmT9Ng931tZ38plTY3tjK5wpSCUPCJN1WTY0QUtQVU6PFBDJKGFrU0olFmYoYhhQj2YQaw4qaBIhpI8tmTDMtU5bTIPe7W6rV2b5tHLlOhbnHBnPrjlm2jdlNhoINMqMEyV3_nnnA3CQg_wBfqoyK
ContentType Journal Article
Copyright 2023 一般社団法人 日本医療情報学会
Copyright_xml – notice: 2023 一般社団法人 日本医療情報学会
DOI 10.14948/jami.42.211
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
EISSN 2188-8469
EndPage 215
ExternalDocumentID article_jami_42_5_42_42_211_article_char_ja
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
JSF
KQ8
OK1
RJT
ID FETCH-LOGICAL-j205a-9e6c7555f94c78f78f31f780d8d95d8a61a208213c07a24678f5ce1deaa7cdc33
ISSN 0289-8055
IngestDate Wed Sep 03 06:31:17 EDT 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed false
IsScholarly true
Issue 5
Language Japanese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-j205a-9e6c7555f94c78f78f31f780d8d95d8a61a208213c07a24678f5ce1deaa7cdc33
OpenAccessLink https://www.jstage.jst.go.jp/article/jami/42/5/42_42.211/_article/-char/ja
PageCount 5
ParticipantIDs jstage_primary_article_jami_42_5_42_42_211_article_char_ja
PublicationCentury 2000
PublicationDate 2023/03/03
PublicationDateYYYYMMDD 2023-03-03
PublicationDate_xml – month: 03
  year: 2023
  text: 2023/03/03
  day: 03
PublicationDecade 2020
PublicationTitle 医療情報学
PublicationTitleAlternate 医療情報学
PublicationYear 2023
Publisher 一般社団法人 日本医療情報学会
Publisher_xml – name: 一般社団法人 日本医療情報学会
References 7) Ott M, Edunov S, Baevski A, et al. fairseq: A fast, extensible toolkit for sequence modeling. proceedings of the 2019 conference of the North American chapter of the association for computational linguistics (demonstrations) 2019: 48-53.
3) googletrans. [https://pypi.org/project/Googletrans/(cited:2022-Dec-8)].
1) 日本医療機器産業連合会.医療機器不具合用語集の活用について.[https://www.jfmda.gr.jp/activity/committee/fuguai/ (cited:2022-Dec-8)].
6) Brown TB, Mann B, Ryder N, et al. Language models are few-shot learners, arXiv:2005.14165.
2) The International Medical Device Regulators Forum. Adverse event terminology. https://www.imdrf.org/working-groups/adverse-event-terminology (cited:2022-Dec-8)].
4) Tan Y, Tran C, Li X, et al. Multilingual translation with extensible multilingual pretraining and finetuning, arXiv:2008.00401.
5) Fan A, Bhosale S, Schwenk H, et al. Beyond English-centric multilingual machine translation, arXiv:2010.11125.
References_xml – reference: 7) Ott M, Edunov S, Baevski A, et al. fairseq: A fast, extensible toolkit for sequence modeling. proceedings of the 2019 conference of the North American chapter of the association for computational linguistics (demonstrations) 2019: 48-53.
– reference: 1) 日本医療機器産業連合会.医療機器不具合用語集の活用について.[https://www.jfmda.gr.jp/activity/committee/fuguai/ (cited:2022-Dec-8)].
– reference: 6) Brown TB, Mann B, Ryder N, et al. Language models are few-shot learners, arXiv:2005.14165.
– reference: 2) The International Medical Device Regulators Forum. Adverse event terminology. https://www.imdrf.org/working-groups/adverse-event-terminology (cited:2022-Dec-8)].
– reference: 4) Tan Y, Tran C, Li X, et al. Multilingual translation with extensible multilingual pretraining and finetuning, arXiv:2008.00401.
– reference: 5) Fan A, Bhosale S, Schwenk H, et al. Beyond English-centric multilingual machine translation, arXiv:2010.11125.
– reference: 3) googletrans. [https://pypi.org/project/Googletrans/(cited:2022-Dec-8)].
SSID ssib000751040
ssib005879655
ssib007482534
ssj0002505442
ssib000994792
Score 2.3405275
Snippet ...
SourceID jstage
SourceType Publisher
StartPage 211
SubjectTerms Sequence-to-sequence
Transformer
医療機器不具合用語集
機械翻訳
Title 英語版医療機器不具合用語集を対象とした深層学習による機械翻訳の精度評価
URI https://www.jstage.jst.go.jp/article/jami/42/5/42_42.211/_article/-char/ja
Volume 42
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 医療情報学, 2023/03/03, Vol.42(5), pp.211-215
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpV3Na9RAFA-1XryIouI3PTjHXTOTTDLTW7LNUhQFoYXelnxCe6gi7cXbLiiVKkhRpAiWipSt4sfqoWKh_WPSdNf_wjcvyTbFHqzCMgzz3u-9N-9Ndt6EmYmm3TAMmFepTGqUBgEsUCJ45mgQ1wIWmNJKEiPy1eHkO3etyWnz1gyfGRkdr-xaWlwI6uGjI8-V_EtUoQ3iqk7JHiOyQ6HQAHWIL5QQYSj_KsbEE0S4xKWq4jhEesSziZBECOJxIhrEdVWLhBZGPIs4ksimIkGLAzwmcUHCBDJz4tpI0hEOKBN5hpIB6xJhEc9Q0iRTzE6TuJ7iARsciiSKKKxIu6w0lXaQr0zlyGwifII4ltLlNlFgDncLFUKUFbdiPFQYcfUCpToolEbXKOHoBJehYaDLQRUC4Ry77IGp1aT8aF8JQ_lEGakXZqO15QjFTuuFz6CUuRc9ZSMMW7TBKmwAoNQPgLnXHaUEUBAu5LdQvoFkhxy8P0EKBiGnQCeQfxj6Kn_x_oYZuIHNGD5xpVIdcSCtoQx0zMJACKzSbCkvFk5SItEqCKLDsdJA2DF8hYIaRDqV6QaW3pCv5Jcm12Nsg_xP1CBDldX50mSV_wV-aPKjlTyK5cd0_5ii1X1E-bchZusmqw9Bhy49Lx6pluJqmazFVQE_4G6VNHUsERhOaCeZbVO1nff2PVFNhalevcdIStOu7CDgwpbVM9m2KRgvrkpUWZxaGpj47a2hY4pzM6oDNyvmQ-46Byu5chcoJqZTZ7TTxYpyzMntPauNzPnntNnBcm_w4W3_6VL2bLu_2tnfXMtWu3s_nmePt7IXS_2XXaD-evMk7axkX3YGvfW03U3br9P22v5WL-u9zz5t9HdX0vbHtLOUdpYBvv_ua393e9D9nrY_97_tZD83Bpuv9nbWz2vTTW-qMVkrvqpSm2M692sytkKbc55IM7RFAj-DQqlHIpI8Er5FfQbrAmqEuu0zyKNEwsOYRrHv22EUGsYFbXT-_nx8URujIQ_ChNl-xCOTwmDRQxkG0vBjTpMooJe08dwzrQf51TmtY8T18v-Ar2inDp61q9rowsPF-BqsHhaC6zhMfgOZoOwG
linkProvider Colorado Alliance of Research Libraries
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E8%8B%B1%E8%AA%9E%E7%89%88%E5%8C%BB%E7%99%82%E6%A9%9F%E5%99%A8%E4%B8%8D%E5%85%B7%E5%90%88%E7%94%A8%E8%AA%9E%E9%9B%86%E3%82%92%E5%AF%BE%E8%B1%A1%E3%81%A8%E3%81%97%E3%81%9F%E6%B7%B1%E5%B1%A4%E5%AD%A6%E7%BF%92%E3%81%AB%E3%82%88%E3%82%8B%E6%A9%9F%E6%A2%B0%E7%BF%BB%E8%A8%B3%E3%81%AE%E7%B2%BE%E5%BA%A6%E8%A9%95%E4%BE%A1&rft.jtitle=%E5%8C%BB%E7%99%82%E6%83%85%E5%A0%B1%E5%AD%A6&rft.au=%E8%B0%B7%E5%B7%9D%E5%8E%9F%2C+%E7%B6%BE%E5%AD%90&rft.au=%E4%B8%8A%E6%9D%89%2C+%E6%AD%A3%E4%BA%BA&rft.au=%E6%A8%AA%E4%BA%95%2C+%E8%8B%B1%E4%BA%BA&rft.date=2023-03-03&rft.pub=%E4%B8%80%E8%88%AC%E7%A4%BE%E5%9B%A3%E6%B3%95%E4%BA%BA+%E6%97%A5%E6%9C%AC%E5%8C%BB%E7%99%82%E6%83%85%E5%A0%B1%E5%AD%A6%E4%BC%9A&rft.issn=0289-8055&rft.eissn=2188-8469&rft.volume=42&rft.issue=5&rft.spage=211&rft.epage=215&rft_id=info:doi/10.14948%2Fjami.42.211&rft.externalDocID=article_jami_42_5_42_42_211_article_char_ja
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=0289-8055&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=0289-8055&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=0289-8055&client=summon