효과적인 문서 수준의 정보를 이용한 합성곱 신경망 기반의 신규성 탐지

웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한...

Full description

Saved in:
Bibliographic Details
Published in정보처리학회논문지. KIPS transactions on computer and communication systems 컴퓨터 및 통신 시스템 Vol. 9; no. 10; pp. 231 - 238
Main Authors 조성웅, Seongung Jo, 오흥선, Heung-seon Oh, 임상훈, Sanghun Im, 김선호, Seonho Kim
Format Journal Article
LanguageKorean
Published 한국정보처리학회 31.10.2020
Subjects
Online AccessGet full text
ISSN2287-5891

Cover

Abstract 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한 해결책으로, 본 논문에서는 합성곱신경망 기반 신규성 탐지 모델 구조를 개선하여 문서 수준 정보를 효과적으로 사용하는 두 가지 방법을 제안한다. 본 논문에서 제안하는 방법은 대상(target) 문서와 증거로 주어진 출처(source) 문서 사이의 상대적(relative) 정보를 추출하여 신규성을 분류할 대상 문서의 특징 벡터를 구성하는 것에 초점을 맞춘다. 본 논문에서는 표준 벤치마크 데이터 셋인 TAP-DLND 1.0를 이용하여 여러 실험을 통해서 제안한 방법의 우수성을 보여준다. With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel documents by discarding documents sharing redundant information already seen. A recent work proposed a convolutional neural network (CNN)-based novelty detection model with significant performance improvements. We observed that it has a restriction of using document-level information in determining novelty but assumed that the document-level information is more important. As a solution, this paper proposed two methods of effectively incorporating document-level information using a CNN-based novelty detection model. Our methods focus on constructing a feature vector of a target document to be classified by extracting relative information between the target document and source documents given as evidence. A series of experiments showed the superiority of our methods on a standard benchmark collection, TAP-DLND 1.0.
AbstractList 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한 해결책으로, 본 논문에서는 합성곱신경망 기반 신규성 탐지 모델 구조를 개선하여 문서 수준 정보를 효과적으로 사용하는 두 가지 방법을 제안한다. 본 논문에서 제안하는 방법은 대상(target) 문서와 증거로 주어진 출처(source) 문서 사이의 상대적(relative) 정보를 추출하여 신규성을 분류할 대상 문서의 특징 벡터를 구성하는 것에 초점을 맞춘다. 본 논문에서는 표준 벤치마크 데이터 셋인 TAP-DLND 1.0를 이용하여 여러 실험을 통해서 제안한 방법의 우수성을 보여준다. With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel documents by discarding documents sharing redundant information already seen. A recent work proposed a convolutional neural network (CNN)-based novelty detection model with significant performance improvements. We observed that it has a restriction of using document-level information in determining novelty but assumed that the document-level information is more important. As a solution, this paper proposed two methods of effectively incorporating document-level information using a CNN-based novelty detection model. Our methods focus on constructing a feature vector of a target document to be classified by extracting relative information between the target document and source documents given as evidence. A series of experiments showed the superiority of our methods on a standard benchmark collection, TAP-DLND 1.0.
With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel documents by discarding documents sharing redundant information already seen. A recent work proposed a convolutional neural network (CNN)-based novelty detection model with significant performance improvements. We observed that it has a restriction of using document-level information in determining novelty but assumed that the document-level information is more important. As a solution, this paper proposed two methods of effectively incorporating document-level information using a CNN-based novelty detection model. Our methods focus on constructing a feature vector of a target document to be classified by extracting relative information between the target document and source documents given as evidence. A series of experiments showed the superiority of our methods on a standard benchmark collection, TAP-DLND 1.0. 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한 해결책으로, 본 논문에서는 합성곱 신경망 기반 신규성 탐지 모델 구조를 개선하여 문서 수준 정보를 효과적으로 사용하는 두 가지 방법을 제안한다. 본 논문에서 제안하는 방법은 대상(target) 문서와 증거로 주어진 출처(source) 문서 사이의 상대적(relative) 정보를 추출하여 신규성을 분류할 대상 문서의 특징 벡터를 구성하는 것에 초점을 맞춘다. 본 논문에서는 표준 벤치마크 데이터 셋인 TAP-DLND 1.0를 이용하여 여러 실험을 통해서 제안한 방법의 우수성을 보여준다.
Author Seonho Kim
Sanghun Im
Heung-seon Oh
조성웅
오흥선
Seongung Jo
임상훈
김선호
Author_xml – sequence: 1
  fullname: 조성웅
– sequence: 2
  fullname: Seongung Jo
– sequence: 3
  fullname: 오흥선
– sequence: 4
  fullname: Heung-seon Oh
– sequence: 5
  fullname: 임상훈
– sequence: 6
  fullname: Sanghun Im
– sequence: 7
  fullname: 김선호
– sequence: 8
  fullname: Seonho Kim
BookMark eNo9j0tLAlEAhe_CIDN_QZu7aTlw34-lSG_BjfvpOs7AoFk4bdoZuQjatBFEHHBRmNBCU8iF_aGZO_-hoaLVgY_vHDh7oNC97voFUCRESYcrjXdBOYrCJsKEMUGwKoLLbPyWrLZ2em_jDUzfN3YwgfZxZF_6Nh5BOx2mq3X6uoU2XtvxPBtOYDac28EyWS2hfZomH1_pLIbJZpEuRj-NnH1OcgFmD8921t8HO4HpRH75L0ugcXzUqJ46tfrJWbVSc9ocIcdIJoWiXAitOcUSBV5TMyo1MxQb4yEvCITX5IwoP-een38wUiGNSIu3tKYlcPg72w6j29DttqKOe165qBNEEMWMK4Go5Cj3Dv69yL3phVemd-dSRbEign4DgBB19Q
ContentType Journal Article
DBID HZB
Q5X
JDI
DEWEY 004
DatabaseName 한국학술정보 KISS
Korean Studies Information Service System (KISS) B-Type
[Open Access] KoreaScience
DatabaseTitleList

DeliveryMethod fulltext_linktorsrc
Discipline Computer Science
DocumentTitleAlternate 효과적인 문서 수준의 정보를 이용한 합성곱 신경망 기반의 신규성 탐지
EndPage 238
ExternalDocumentID JAKO202031458603750
3831826
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
HZB
Q5X
.UV
JDI
ID FETCH-LOGICAL-k500-a7476835669953170fcb943794a31aac0cff6cb5428e943ceb01a780902d5d993
ISSN 2287-5891
IngestDate Fri Dec 22 11:59:35 EST 2023
Tue Oct 14 02:11:12 EDT 2025
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Issue 10
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-k500-a7476835669953170fcb943794a31aac0cff6cb5428e943ceb01a780902d5d993
Notes Korea Information Processing Society
KISTI1.1003/JNL.JAKO202031458603750
OpenAccessLink http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO202031458603750&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
PageCount 8
ParticipantIDs kisti_ndsl_JAKO202031458603750
kiss_primary_3831826
PublicationCentury 2000
PublicationDate 20201031
PublicationDateYYYYMMDD 2020-10-31
PublicationDate_xml – month: 10
  year: 2020
  text: 20201031
  day: 31
PublicationDecade 2020
PublicationTitle 정보처리학회논문지. KIPS transactions on computer and communication systems 컴퓨터 및 통신 시스템
PublicationTitleAlternate 정보처리학회논문지. 컴퓨터 및 통신시스템(KTCCS)
PublicationYear 2020
Publisher 한국정보처리학회
Publisher_xml – name: 한국정보처리학회
SSID ssib012446218
ssib044742767
ssib013223550
ssib014210004
ssib058467651
ssib053377452
Score 1.7506754
Snippet 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성...
With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel...
SourceID kisti
kiss
SourceType Open Access Repository
Publisher
StartPage 231
SubjectTerms CNN
Deep Learning
Novelty Detection
딥 러닝
신규성 탐지
합성곱 신경망
Title 효과적인 문서 수준의 정보를 이용한 합성곱 신경망 기반의 신규성 탐지
URI https://kiss.kstudy.com/ExternalLink/Ar?key=3831826
http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO202031458603750&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
Volume 9
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  issn: 2287-5891
  databaseCode: M~E
  dateStart: 20120101
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://road.issn.org
  omitProxy: true
  ssIdentifier: ssib044742767
  providerName: ISSN International Centre
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR3LThRBcAKcvPhCIz7IHOzTZsk8ema6jzOzSxCCmogJt3V2dicxEDACFw8GIwcTL15ICGETDhok8QBCIgf8od1Zv8Gqmp6HhsTHZdJbU11dj-ntqn6Vpt13PYObCV45K5OozjsO9Ll2F9fg3cRpG5HtRngaef6hO_OUzy46iyOjPyq7ljbW21PxqwvPlfyPVQEGdsVTsv9g2YIoAKAM9oUnWBief2Vj1mww6TNfsKbPApsFIWuGzDfAPcSCbLBA1FgzYH4IJQQJzmRYo5JgkkA-x90OGboUNUVBOlgPaXIi4ADxWk6UUwEalsSBk9GkEoKomcDMmTKz9gIkiyCLBQ2i6QGxGoEECwxqz1BMlbyU9QA9LIhTe8JmklgHUlmmptzPvkiKEJtG8kDRRZUo3qVSowjxlXBIjRWdEfGp2tyDx08wo0aeXp3WWWKVFCM_HlgetlF3ZK-REEFAHEAzNlmrQUIYNSWzmM7EcVngFDLn0iuhfTQUIqG2825C7JmkvELpoDyUoooCQmeVQa2-o3B94xeUJsLwjU1fT4OoiBIFDCDVh0KVCQXsJqrzRpZRGXBpeLEgVq5jTsnqWCirXd6oDmyqalf9EqX_kO-Z-M2tKDZ7zvpzj5AB2-SOcDHnsjGqjdom5huZf93M__3R0XSt0lPCaRJwhovRxOQWrkUVowfnHre80nmGuAVCGUqxVYgGfhaEYWsQeGI09rziOS5c1S6rkE_3s_57TRtZWr2uXcnTqehqdB3Xng13P_dPztP9N2nvTB98OUu39vT03U76cTPt7ejp_vbg5HTw6VxPe6fp7uFwe08fbh-mW8f9k2M9fb_f__p9cNDT-2dHg6MdqgGwb3uAoA_ffkgPNm9oC9PNhXCmrhKg1Jccw6hHEOq7ECG5rpQwVHpGErcl3h_KI9uMotiIk8SN2w63RBfgcReUFHkCd1p3nA4EHje1sZXVle4tTcdZAysRsZ10wAo8Em0P9GOBM594uFoxoY2jolovsituWrawceJhQpskxbVWOmvLrQsMeftPCHe0S-XHd1cbW3-50b0Hbvx6e5Ks_xNHlsMe
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%ED%9A%A8%EA%B3%BC%EC%A0%81%EC%9D%B8+%EB%AC%B8%EC%84%9C+%EC%88%98%EC%A4%80%EC%9D%98+%EC%A0%95%EB%B3%B4%EB%A5%BC+%EC%9D%B4%EC%9A%A9%ED%95%9C+%ED%95%A9%EC%84%B1%EA%B3%B1+%EC%8B%A0%EA%B2%BD%EB%A7%9D+%EA%B8%B0%EB%B0%98%EC%9D%98+%EC%8B%A0%EA%B7%9C%EC%84%B1+%ED%83%90%EC%A7%80&rft.jtitle=%EC%A0%95%EB%B3%B4%EC%B2%98%EB%A6%AC%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80.+KIPS+transactions+on+computer+and+communication+systems+%EC%BB%B4%ED%93%A8%ED%84%B0+%EB%B0%8F+%ED%86%B5%EC%8B%A0+%EC%8B%9C%EC%8A%A4%ED%85%9C&rft.au=%EC%A1%B0%EC%84%B1%EC%9B%85&rft.au=%EC%98%A4%ED%9D%A5%EC%84%A0&rft.au=%EC%9E%84%EC%83%81%ED%9B%88&rft.au=%EA%B9%80%EC%84%A0%ED%98%B8&rft.date=2020-10-31&rft.issn=2287-5891&rft.volume=9&rft.issue=10&rft.spage=231&rft.epage=238&rft.externalDBID=n%2Fa&rft.externalDocID=JAKO202031458603750
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2287-5891&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2287-5891&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2287-5891&client=summon