問合せデータの分散表現を用いた分類
情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,多くの経験と知識が必要となる.しかし多くの情報系センターでは,昨今の予算不足により任期付きのポジションへの変更や人員削減が行われ,問合わせ対応を的確に行うための経験や知識の継承が問題となっている.問合せとその回答が電子データとして蓄積されている場合,問合せデータを機械的にカテゴライズできれば,カテゴライズされた過去の回答データを参考に回答するといった,人の経験や知識に頼らない業務フローの構築が行える.本研究では,カテゴライズするために1つ...
Saved in:
Published in | 学術情報処理研究 Vol. 24; no. 1; pp. 68 - 77 |
---|---|
Main Authors | , , , , , , |
Format | Journal Article |
Language | Japanese |
Published |
国立大学法人 情報系センター協議会
01.12.2020
|
Subjects | |
Online Access | Get full text |
ISSN | 1343-2915 2433-7595 |
DOI | 10.24669/jacn.24.1_68 |
Cover
Abstract | 情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,多くの経験と知識が必要となる.しかし多くの情報系センターでは,昨今の予算不足により任期付きのポジションへの変更や人員削減が行われ,問合わせ対応を的確に行うための経験や知識の継承が問題となっている.問合せとその回答が電子データとして蓄積されている場合,問合せデータを機械的にカテゴライズできれば,カテゴライズされた過去の回答データを参考に回答するといった,人の経験や知識に頼らない業務フローの構築が行える.本研究では,カテゴライズするために1つの問合せを1つの文書データとみた分散表現による文書ベクトルを導出し,文書ベクトルを使ったクラスタ分析,特徴量の抽出を行う.この方法により,客観的な数値データからカテゴライズ可能か検証する. |
---|---|
AbstractList | 情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,多くの経験と知識が必要となる.しかし多くの情報系センターでは,昨今の予算不足により任期付きのポジションへの変更や人員削減が行われ,問合わせ対応を的確に行うための経験や知識の継承が問題となっている.問合せとその回答が電子データとして蓄積されている場合,問合せデータを機械的にカテゴライズできれば,カテゴライズされた過去の回答データを参考に回答するといった,人の経験や知識に頼らない業務フローの構築が行える.本研究では,カテゴライズするために1つの問合せを1つの文書データとみた分散表現による文書ベクトルを導出し,文書ベクトルを使ったクラスタ分析,特徴量の抽出を行う.この方法により,客観的な数値データからカテゴライズ可能か検証する. |
Author | 山本一幸 大瀧保広 佐藤伸也 野口宏 嶌田敏行 羽渕裕真 外岡秀行 |
Author_xml | – sequence: 1 fullname: 佐藤伸也 organization: 茨城大学全学教育機構 – sequence: 1 fullname: 嶌田敏行 organization: 茨城大学全学教育機構 – sequence: 1 fullname: 山本一幸 organization: 茨城大学IT基盤センター – sequence: 1 fullname: 羽渕裕真 organization: 茨城大学大学院理工学研究科 – sequence: 1 fullname: 大瀧保広 organization: 茨城大学IT基盤センター – sequence: 1 fullname: 野口宏 organization: 茨城大学IT基盤センター – sequence: 1 fullname: 外岡秀行 organization: 茨城大学大学院理工学研究科 |
BookMark | eNo9T81Kw0AYXKSCsfboY6Rm99tkd48l1D-KXvS8bDaJJtQoSS8e04r2VhF7EpTipSefQPRhllh9C1MVLzPDzDAw66iRnWcRQpvYaRPqeWIrVTqrZRtLj68gi1AAm7nCbSALAwWbCOyuoVZRJIFDKQNGsWshqKaT6nZsygczujGjVzN8N-VLNb7-mD5_zuaLyZsZ3i3u56a8MuVT7X_NHjfQaqz6RdT64yY63u4e-bt273Bnz-_07JQQ4diKBW4cA3O4AowpoQFnjlAqCsMYtNCMgac1DmIuWEi5YgIDYYTQkFHiBBqaqPu7mxYDdRLJizw5U_mlVPkg0f1ILh9LQiVewn7HP_jR_D_XpyqvS_ANPO5lbg |
ContentType | Journal Article |
Copyright | 2020 学術情報処理研究編集委員会 |
Copyright_xml | – notice: 2020 学術情報処理研究編集委員会 |
DOI | 10.24669/jacn.24.1_68 |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
EISSN | 2433-7595 |
EndPage | 77 |
ExternalDocumentID | article_jacn_24_1_24_JACN24_1_8_article_char_ja |
GroupedDBID | ALMA_UNASSIGNED_HOLDINGS JSF RJT |
ID | FETCH-LOGICAL-j2290-a7b5ff3708a311424b8709aaeddf3c9c7736cc1bf897d48a791327224d7420bc3 |
ISSN | 1343-2915 |
IngestDate | Wed Sep 03 06:18:35 EDT 2025 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | true |
IsScholarly | true |
Issue | 1 |
Language | Japanese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-j2290-a7b5ff3708a311424b8709aaeddf3c9c7736cc1bf897d48a791327224d7420bc3 |
OpenAccessLink | https://www.jstage.jst.go.jp/article/jacn/24/1/24_JACN24-1-8/_article/-char/ja |
PageCount | 10 |
ParticipantIDs | jstage_primary_article_jacn_24_1_24_JACN24_1_8_article_char_ja |
PublicationCentury | 2000 |
PublicationDate | 2020/12/01 |
PublicationDateYYYYMMDD | 2020-12-01 |
PublicationDate_xml | – month: 12 year: 2020 text: 2020/12/01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | 学術情報処理研究 |
PublicationTitleAlternate | 学術情報処理研究 |
PublicationYear | 2020 |
Publisher | 国立大学法人 情報系センター協議会 |
Publisher_xml | – name: 国立大学法人 情報系センター協議会 |
References | [4] David Arthur and Sergei Vassilvitskii, k-means++: The Advantages of Careful Seeding, Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, pp. 1027-1035, 2007. [8] 景山明宣, 辻洋, TF/IDF アルゴリズムを用いた研究機関の特徴抽出法, 電気学会論文誌C, 125(5), pp.713-719, 2005. [1] Tomas Mikolov, Kai Chen, Greg Corrado and Jeffrey Dean, Efficient estimation of word representations in vector space, arXiv preprint arXiv:1301.3781, 2013. [12] [12] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto:Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp. 230-237,2004. [14] Laurens van der Maaten and Geoffrey Hinton, Visualizing Data using t-SNE, Journal of Machine Learning Research 9, pp. 2579-2605, 2008. [11] 佐藤彰洋, 中村豊, 小倉光貴, 野林大起, 池永全志, ブラックリストに基づく検出の効率化に向けた悪性DNSクエリ分類手法, 情報処理学会論文誌, 60(10), pp.1780-1795, 2019. [10] 相澤彰子, 大規模テキストコーパスを用いた語の類似度計算に関する考察, 情報処理学科論文誌, 49(3), pp.1426-1436, 2008. [9] 相澤彰子, 語と文書の共起に基づく特徴度の数量的表現について, 情報処理学科論文誌, 41(12), pp.3332-3343, 2000. [13] Douglas Reynolds, Gaussian mixture models, Encyclopedia of biometrics, Springer US, pp. 659-663, 2009. [7] Le, Quoc, and Tomas Mikolov, Distributed rep resentations of sentences and documents, International conference on machine learning, pp. 1188-1196, 2014. [5] G. Salton, Automatic Text Processing, Addison Wesley Publishing Company, 1989. [2] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado and JeffDean, Distributed Representa tions of Words and Phrases and their Compositionality, Advances in Neural Information Processing Systems 26, pp. 3111-3119, 2013. [3] Dheeraj Mekala, Vivek Gupta, Bhargavi Paranjape and Harish Karnick, SCDV:Sparse Composite Document Vectors using soft clustering over distributional representations, Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, pp. 659-669, 2017. [6] Piotr Bojanowski, Edouard Grave, Armand Joulin and Tomas Mikolov, Enriching word vectors with subword information, Transactions of the Association for Computational Linguistics, Vol. 5, pp.135-146, 2017. |
References_xml | – reference: [4] David Arthur and Sergei Vassilvitskii, k-means++: The Advantages of Careful Seeding, Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, pp. 1027-1035, 2007. – reference: [13] Douglas Reynolds, Gaussian mixture models, Encyclopedia of biometrics, Springer US, pp. 659-663, 2009. – reference: [8] 景山明宣, 辻洋, TF/IDF アルゴリズムを用いた研究機関の特徴抽出法, 電気学会論文誌C, 125(5), pp.713-719, 2005. – reference: [12] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto:Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp. 230-237,2004. – reference: [3] Dheeraj Mekala, Vivek Gupta, Bhargavi Paranjape and Harish Karnick, SCDV:Sparse Composite Document Vectors using soft clustering over distributional representations, Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, pp. 659-669, 2017. – reference: [1] Tomas Mikolov, Kai Chen, Greg Corrado and Jeffrey Dean, Efficient estimation of word representations in vector space, arXiv preprint arXiv:1301.3781, 2013. [12] – reference: [6] Piotr Bojanowski, Edouard Grave, Armand Joulin and Tomas Mikolov, Enriching word vectors with subword information, Transactions of the Association for Computational Linguistics, Vol. 5, pp.135-146, 2017. – reference: [7] Le, Quoc, and Tomas Mikolov, Distributed rep resentations of sentences and documents, International conference on machine learning, pp. 1188-1196, 2014. – reference: [9] 相澤彰子, 語と文書の共起に基づく特徴度の数量的表現について, 情報処理学科論文誌, 41(12), pp.3332-3343, 2000. – reference: [2] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado and JeffDean, Distributed Representa tions of Words and Phrases and their Compositionality, Advances in Neural Information Processing Systems 26, pp. 3111-3119, 2013. – reference: [5] G. Salton, Automatic Text Processing, Addison Wesley Publishing Company, 1989. – reference: [14] Laurens van der Maaten and Geoffrey Hinton, Visualizing Data using t-SNE, Journal of Machine Learning Research 9, pp. 2579-2605, 2008. – reference: [10] 相澤彰子, 大規模テキストコーパスを用いた語の類似度計算に関する考察, 情報処理学科論文誌, 49(3), pp.1426-1436, 2008. – reference: [11] 佐藤彰洋, 中村豊, 小倉光貴, 野林大起, 池永全志, ブラックリストに基づく検出の効率化に向けた悪性DNSクエリ分類手法, 情報処理学会論文誌, 60(10), pp.1780-1795, 2019. |
SSID | ssib044737415 ssib003037090 ssib028231303 ssj0003313668 ssib002218867 |
Score | 2.2499702 |
Snippet | 情報系センターの主要な業務のひとつに,利用者からの問合わせへの対応がある.クラウドサービスの使い方からパソコンの不具合まで多岐にわたる問合わせに対応するには,... |
SourceID | jstage |
SourceType | Publisher |
StartPage | 68 |
SubjectTerms | カテゴライズ データ分析 分散表現 問合せデータ 文書ベクトル 機械学習 特徴量 |
Title | 問合せデータの分散表現を用いた分類 |
URI | https://www.jstage.jst.go.jp/article/jacn/24/1/24_JACN24-1-8/_article/-char/ja |
Volume | 24 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | 学術情報処理研究, 2020/12/01, Vol.24(1), pp.68-77 |
journalDatabaseRights | – providerCode: PRVHPJ databaseName: ROAD: Directory of Open Access Scholarly Resources customDbUrl: eissn: 2433-7595 dateEnd: 99991231 omitProxy: true ssIdentifier: ssib044737415 issn: 1343-2915 databaseCode: M~E dateStart: 19970101 isFulltext: true titleUrlDefault: https://road.issn.org providerName: ISSN International Centre |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpR1Na9VAMLT14kUUFb_pwT3Jq8nuJrt7EbJpHqXQnlro7bHJSw49VJH24kF4rWhvFbEnQSleevIXiP4UD-FZ_RfOTJK-vNKDVXiEefO1szNJdjbZzXjew7yQrnB48mp8zejnw54TmesV2jgYb8phWeKjgZXVaGldLm-EGzOzPzqrlna2s4X8xbn7Sv4lqoCDuOIu2QtE9lQpIACG-MIRIgzHv4oxS0NmQqb7BPhMa5YKyA2ZsQTATzWATQjgzPYbnjhFKRDREUsj1BMLlmoWAwn0KFRr00bKcMQYSSQS17Jtq9_RY1DcpN2UF6nxIoujRrkR2BzaFhLJZzYgDYp4FHWEACBBiwgYZk-fILJUMruIXKDPAFESJmFWE2DAoglvCJJMJ4311m-6ii4ja3QyxRuQMcCSsDghdRrXgiAJbNATXoW-ATOAF1hAI6oTBCiUbmxonqfws2tTKGCWFEAPLNOWfAH-VR1_ge5aJdgRw-_ReZ5TyGRtG9428oCcCnh9CkDPF8mpGttAd5DrTNwZnITEunv19teFgnBcCtFTYV2otB3R6l3pU1duPTzVFYyaRKcun3N2COUyigzVbsi34M9CMGiFpr5K3pzzA2QbcDkI8LAcJ6sE60FLx72DwDTrXeIqirDEyMrLtJM_BlpH3fmsUP7ktS3Hd9RiskxASiVUO__HVEsAOaq3u7a-qb-jS7143O0DZJibMN9q12pS-rh21bvSzPvm49rga97MprvuifHhwfjtfjX6UO29qfa-Vrvfq9GX8f7rn4effx0dnxx8q3bfnbw_rkavqtEnwP8--njDW--na8lSr6li0tvEWgo9p7IQbnjK107gxnWZwRBpnCuGw1LkJldKRHkeZKU2aii1UyYQXEFmPVSS-1kubnpzW0-3ilvevJBw9wxDLlyOKzlKx3kZFKX2c20izd1t70ndx8Gz-lM1gwuG6c7_KrjrXZ5cU_e8ue3nO8V9yNq3swcU-T9sVrUn |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%95%8F%E5%90%88%E3%81%9B%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%88%86%E6%95%A3%E8%A1%A8%E7%8F%BE%E3%82%92%E7%94%A8%E3%81%84%E3%81%9F%E5%88%86%E9%A1%9E&rft.jtitle=%E5%AD%A6%E8%A1%93%E6%83%85%E5%A0%B1%E5%87%A6%E7%90%86%E7%A0%94%E7%A9%B6&rft.au=%E4%BD%90%E8%97%A4%E4%BC%B8%E4%B9%9F&rft.au=%E5%B6%8C%E7%94%B0%E6%95%8F%E8%A1%8C&rft.au=%E5%B1%B1%E6%9C%AC%E4%B8%80%E5%B9%B8&rft.au=%E7%BE%BD%E6%B8%95%E8%A3%95%E7%9C%9F&rft.date=2020-12-01&rft.pub=%E5%9B%BD%E7%AB%8B%E5%A4%A7%E5%AD%A6%E6%B3%95%E4%BA%BA+%E6%83%85%E5%A0%B1%E7%B3%BB%E3%82%BB%E3%83%B3%E3%82%BF%E3%83%BC%E5%8D%94%E8%AD%B0%E4%BC%9A&rft.issn=1343-2915&rft.eissn=2433-7595&rft.volume=24&rft.issue=1&rft.spage=68&rft.epage=77&rft_id=info:doi/10.24669%2Fjacn.24.1_68&rft.externalDocID=article_jacn_24_1_24_JACN24_1_8_article_char_ja |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1343-2915&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1343-2915&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1343-2915&client=summon |