問合せデータの分散表現を用いた分類

情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,多くの経験と知識が必要となる.しかし多くの情報系センターでは,昨今の予算不足により任期付きのポジションへの変更や人員削減が行われ,問合わせ対応を的確に行うための経験や知識の継承が問題となっている.問合せとその回答が電子データとして蓄積されている場合,問合せデータを機械的にカテゴライズできれば,カテゴライズされた過去の回答データを参考に回答するといった,人の経験や知識に頼らない業務フローの構築が行える.本研究では,カテゴライズするために1つ...

Full description

Saved in:
Bibliographic Details
Published in学術情報処理研究 Vol. 24; no. 1; pp. 68 - 77
Main Authors 佐藤伸也, 嶌田敏行, 山本一幸, 羽渕裕真, 大瀧保広, 野口宏, 外岡秀行
Format Journal Article
LanguageJapanese
Published 国立大学法人 情報系センター協議会 01.12.2020
Subjects
Online AccessGet full text
ISSN1343-2915
2433-7595
DOI10.24669/jacn.24.1_68

Cover

Abstract 情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,多くの経験と知識が必要となる.しかし多くの情報系センターでは,昨今の予算不足により任期付きのポジションへの変更や人員削減が行われ,問合わせ対応を的確に行うための経験や知識の継承が問題となっている.問合せとその回答が電子データとして蓄積されている場合,問合せデータを機械的にカテゴライズできれば,カテゴライズされた過去の回答データを参考に回答するといった,人の経験や知識に頼らない業務フローの構築が行える.本研究では,カテゴライズするために1つの問合せを1つの文書データとみた分散表現による文書ベクトルを導出し,文書ベクトルを使ったクラスタ分析,特徴量の抽出を行う.この方法により,客観的な数値データからカテゴライズ可能か検証する.
AbstractList 情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,多くの経験と知識が必要となる.しかし多くの情報系センターでは,昨今の予算不足により任期付きのポジションへの変更や人員削減が行われ,問合わせ対応を的確に行うための経験や知識の継承が問題となっている.問合せとその回答が電子データとして蓄積されている場合,問合せデータを機械的にカテゴライズできれば,カテゴライズされた過去の回答データを参考に回答するといった,人の経験や知識に頼らない業務フローの構築が行える.本研究では,カテゴライズするために1つの問合せを1つの文書データとみた分散表現による文書ベクトルを導出し,文書ベクトルを使ったクラスタ分析,特徴量の抽出を行う.この方法により,客観的な数値データからカテゴライズ可能か検証する.
Author 山本一幸
大瀧保広
佐藤伸也
野口宏
嶌田敏行
羽渕裕真
外岡秀行
Author_xml – sequence: 1
  fullname: 佐藤伸也
  organization: 茨城大学全学教育機構
– sequence: 1
  fullname: 嶌田敏行
  organization: 茨城大学全学教育機構
– sequence: 1
  fullname: 山本一幸
  organization: 茨城大学IT基盤センター
– sequence: 1
  fullname: 羽渕裕真
  organization: 茨城大学大学院理工学研究科
– sequence: 1
  fullname: 大瀧保広
  organization: 茨城大学IT基盤センター
– sequence: 1
  fullname: 野口宏
  organization: 茨城大学IT基盤センター
– sequence: 1
  fullname: 外岡秀行
  organization: 茨城大学大学院理工学研究科
BookMark eNo9T81Kw0AYXKSCsfboY6Rm99tkd48l1D-KXvS8bDaJJtQoSS8e04r2VhF7EpTipSefQPRhllh9C1MVLzPDzDAw66iRnWcRQpvYaRPqeWIrVTqrZRtLj68gi1AAm7nCbSALAwWbCOyuoVZRJIFDKQNGsWshqKaT6nZsygczujGjVzN8N-VLNb7-mD5_zuaLyZsZ3i3u56a8MuVT7X_NHjfQaqz6RdT64yY63u4e-bt273Bnz-_07JQQ4diKBW4cA3O4AowpoQFnjlAqCsMYtNCMgac1DmIuWEi5YgIDYYTQkFHiBBqaqPu7mxYDdRLJizw5U_mlVPkg0f1ILh9LQiVewn7HP_jR_D_XpyqvS_ANPO5lbg
ContentType Journal Article
Copyright 2020 学術情報処理研究編集委員会
Copyright_xml – notice: 2020 学術情報処理研究編集委員会
DOI 10.24669/jacn.24.1_68
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
EISSN 2433-7595
EndPage 77
ExternalDocumentID article_jacn_24_1_24_JACN24_1_8_article_char_ja
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
JSF
RJT
ID FETCH-LOGICAL-j2290-a7b5ff3708a311424b8709aaeddf3c9c7736cc1bf897d48a791327224d7420bc3
ISSN 1343-2915
IngestDate Wed Sep 03 06:18:35 EDT 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue 1
Language Japanese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-j2290-a7b5ff3708a311424b8709aaeddf3c9c7736cc1bf897d48a791327224d7420bc3
OpenAccessLink https://www.jstage.jst.go.jp/article/jacn/24/1/24_JACN24-1-8/_article/-char/ja
PageCount 10
ParticipantIDs jstage_primary_article_jacn_24_1_24_JACN24_1_8_article_char_ja
PublicationCentury 2000
PublicationDate 2020/12/01
PublicationDateYYYYMMDD 2020-12-01
PublicationDate_xml – month: 12
  year: 2020
  text: 2020/12/01
  day: 01
PublicationDecade 2020
PublicationTitle 学術情報処理研究
PublicationTitleAlternate 学術情報処理研究
PublicationYear 2020
Publisher 国立大学法人 情報系センター協議会
Publisher_xml – name: 国立大学法人 情報系センター協議会
References [4] David Arthur and Sergei Vassilvitskii, k-means++: The Advantages of Careful Seeding, Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, pp. 1027-1035, 2007.
[8] 景山明宣, 辻洋, TF/IDF アルゴリズムを用いた研究機関の特徴抽出法, 電気学会論文誌C, 125(5), pp.713-719, 2005.
[1] Tomas Mikolov, Kai Chen, Greg Corrado and Jeffrey Dean, Efficient estimation of word representations in vector space, arXiv preprint arXiv:1301.3781, 2013. [12]
[12] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto:Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp. 230-237,2004.
[14] Laurens van der Maaten and Geoffrey Hinton, Visualizing Data using t-SNE, Journal of Machine Learning Research 9, pp. 2579-2605, 2008.
[11] 佐藤彰洋, 中村豊, 小倉光貴, 野林大起, 池永全志, ブラックリストに基づく検出の効率化に向けた悪性DNSクエリ分類手法, 情報処理学会論文誌, 60(10), pp.1780-1795, 2019.
[10] 相澤彰子, 大規模テキストコーパスを用いた語の類似度計算に関する考察, 情報処理学科論文誌, 49(3), pp.1426-1436, 2008.
[9] 相澤彰子, 語と文書の共起に基づく特徴度の数量的表現について, 情報処理学科論文誌, 41(12), pp.3332-3343, 2000.
[13] Douglas Reynolds, Gaussian mixture models, Encyclopedia of biometrics, Springer US, pp. 659-663, 2009.
[7] Le, Quoc, and Tomas Mikolov, Distributed rep resentations of sentences and documents, International conference on machine learning, pp. 1188-1196, 2014.
[5] G. Salton, Automatic Text Processing, Addison Wesley Publishing Company, 1989.
[2] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado and JeffDean, Distributed Representa tions of Words and Phrases and their Compositionality, Advances in Neural Information Processing Systems 26, pp. 3111-3119, 2013.
[3] Dheeraj Mekala, Vivek Gupta, Bhargavi Paranjape and Harish Karnick, SCDV:Sparse Composite Document Vectors using soft clustering over distributional representations, Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, pp. 659-669, 2017.
[6] Piotr Bojanowski, Edouard Grave, Armand Joulin and Tomas Mikolov, Enriching word vectors with subword information, Transactions of the Association for Computational Linguistics, Vol. 5, pp.135-146, 2017.
References_xml – reference: [4] David Arthur and Sergei Vassilvitskii, k-means++: The Advantages of Careful Seeding, Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, pp. 1027-1035, 2007.
– reference: [13] Douglas Reynolds, Gaussian mixture models, Encyclopedia of biometrics, Springer US, pp. 659-663, 2009.
– reference: [8] 景山明宣, 辻洋, TF/IDF アルゴリズムを用いた研究機関の特徴抽出法, 電気学会論文誌C, 125(5), pp.713-719, 2005.
– reference: [12] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto:Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp. 230-237,2004.
– reference: [3] Dheeraj Mekala, Vivek Gupta, Bhargavi Paranjape and Harish Karnick, SCDV:Sparse Composite Document Vectors using soft clustering over distributional representations, Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, pp. 659-669, 2017.
– reference: [1] Tomas Mikolov, Kai Chen, Greg Corrado and Jeffrey Dean, Efficient estimation of word representations in vector space, arXiv preprint arXiv:1301.3781, 2013. [12]
– reference: [6] Piotr Bojanowski, Edouard Grave, Armand Joulin and Tomas Mikolov, Enriching word vectors with subword information, Transactions of the Association for Computational Linguistics, Vol. 5, pp.135-146, 2017.
– reference: [7] Le, Quoc, and Tomas Mikolov, Distributed rep resentations of sentences and documents, International conference on machine learning, pp. 1188-1196, 2014.
– reference: [9] 相澤彰子, 語と文書の共起に基づく特徴度の数量的表現について, 情報処理学科論文誌, 41(12), pp.3332-3343, 2000.
– reference: [2] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado and JeffDean, Distributed Representa tions of Words and Phrases and their Compositionality, Advances in Neural Information Processing Systems 26, pp. 3111-3119, 2013.
– reference: [5] G. Salton, Automatic Text Processing, Addison Wesley Publishing Company, 1989.
– reference: [14] Laurens van der Maaten and Geoffrey Hinton, Visualizing Data using t-SNE, Journal of Machine Learning Research 9, pp. 2579-2605, 2008.
– reference: [10] 相澤彰子, 大規模テキストコーパスを用いた語の類似度計算に関する考察, 情報処理学科論文誌, 49(3), pp.1426-1436, 2008.
– reference: [11] 佐藤彰洋, 中村豊, 小倉光貴, 野林大起, 池永全志, ブラックリストに基づく検出の効率化に向けた悪性DNSクエリ分類手法, 情報処理学会論文誌, 60(10), pp.1780-1795, 2019.
SSID ssib044737415
ssib003037090
ssib028231303
ssj0003313668
ssib002218867
Score 2.2499702
Snippet 情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,...
SourceID jstage
SourceType Publisher
StartPage 68
SubjectTerms カテゴライズ
データ分析
分散表現
問合せデータ
文書ベクトル
機械学習
特徴量
Title 問合せデータの分散表現を用いた分類
URI https://www.jstage.jst.go.jp/article/jacn/24/1/24_JACN24-1-8/_article/-char/ja
Volume 24
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 学術情報処理研究, 2020/12/01, Vol.24(1), pp.68-77
journalDatabaseRights – providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  customDbUrl:
  eissn: 2433-7595
  dateEnd: 99991231
  omitProxy: true
  ssIdentifier: ssib044737415
  issn: 1343-2915
  databaseCode: M~E
  dateStart: 19970101
  isFulltext: true
  titleUrlDefault: https://road.issn.org
  providerName: ISSN International Centre
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpR1Na9VAMLT14kUUFb_pwT3Jq8nuJrt7EbJpHqXQnlro7bHJSw49VJH24kF4rWhvFbEnQSleevIXiP4UD-FZ_RfOTJK-vNKDVXiEefO1szNJdjbZzXjew7yQrnB48mp8zejnw54TmesV2jgYb8phWeKjgZXVaGldLm-EGzOzPzqrlna2s4X8xbn7Sv4lqoCDuOIu2QtE9lQpIACG-MIRIgzHv4oxS0NmQqb7BPhMa5YKyA2ZsQTATzWATQjgzPYbnjhFKRDREUsj1BMLlmoWAwn0KFRr00bKcMQYSSQS17Jtq9_RY1DcpN2UF6nxIoujRrkR2BzaFhLJZzYgDYp4FHWEACBBiwgYZk-fILJUMruIXKDPAFESJmFWE2DAoglvCJJMJ4311m-6ii4ja3QyxRuQMcCSsDghdRrXgiAJbNATXoW-ATOAF1hAI6oTBCiUbmxonqfws2tTKGCWFEAPLNOWfAH-VR1_ge5aJdgRw-_ReZ5TyGRtG9428oCcCnh9CkDPF8mpGttAd5DrTNwZnITEunv19teFgnBcCtFTYV2otB3R6l3pU1duPTzVFYyaRKcun3N2COUyigzVbsi34M9CMGiFpr5K3pzzA2QbcDkI8LAcJ6sE60FLx72DwDTrXeIqirDEyMrLtJM_BlpH3fmsUP7ktS3Hd9RiskxASiVUO__HVEsAOaq3u7a-qb-jS7143O0DZJibMN9q12pS-rh21bvSzPvm49rga97MprvuifHhwfjtfjX6UO29qfa-Vrvfq9GX8f7rn4effx0dnxx8q3bfnbw_rkavqtEnwP8--njDW--na8lSr6li0tvEWgo9p7IQbnjK107gxnWZwRBpnCuGw1LkJldKRHkeZKU2aii1UyYQXEFmPVSS-1kubnpzW0-3ilvevJBw9wxDLlyOKzlKx3kZFKX2c20izd1t70ndx8Gz-lM1gwuG6c7_KrjrXZ5cU_e8ue3nO8V9yNq3swcU-T9sVrUn
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%95%8F%E5%90%88%E3%81%9B%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%88%86%E6%95%A3%E8%A1%A8%E7%8F%BE%E3%82%92%E7%94%A8%E3%81%84%E3%81%9F%E5%88%86%E9%A1%9E&rft.jtitle=%E5%AD%A6%E8%A1%93%E6%83%85%E5%A0%B1%E5%87%A6%E7%90%86%E7%A0%94%E7%A9%B6&rft.au=%E4%BD%90%E8%97%A4%E4%BC%B8%E4%B9%9F&rft.au=%E5%B6%8C%E7%94%B0%E6%95%8F%E8%A1%8C&rft.au=%E5%B1%B1%E6%9C%AC%E4%B8%80%E5%B9%B8&rft.au=%E7%BE%BD%E6%B8%95%E8%A3%95%E7%9C%9F&rft.date=2020-12-01&rft.pub=%E5%9B%BD%E7%AB%8B%E5%A4%A7%E5%AD%A6%E6%B3%95%E4%BA%BA+%E6%83%85%E5%A0%B1%E7%B3%BB%E3%82%BB%E3%83%B3%E3%82%BF%E3%83%BC%E5%8D%94%E8%AD%B0%E4%BC%9A&rft.issn=1343-2915&rft.eissn=2433-7595&rft.volume=24&rft.issue=1&rft.spage=68&rft.epage=77&rft_id=info:doi/10.24669%2Fjacn.24.1_68&rft.externalDocID=article_jacn_24_1_24_JACN24_1_8_article_char_ja
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1343-2915&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1343-2915&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1343-2915&client=summon