효과적인 문서 수준의 정보를 이용한 합성곱 신경망 기반의 신규성 탐지
웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한...
        Saved in:
      
    
          | Published in | 정보처리학회논문지. KIPS transactions on computer and communication systems 컴퓨터 및 통신 시스템 Vol. 9; no. 10; pp. 231 - 238 | 
|---|---|
| Main Authors | , , , , , , , | 
| Format | Journal Article | 
| Language | Korean | 
| Published | 
            한국정보처리학회
    
        31.10.2020
     | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 2287-5891 | 
Cover
| Abstract | 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한 해결책으로, 본 논문에서는 합성곱신경망 기반 신규성 탐지 모델 구조를 개선하여 문서 수준 정보를 효과적으로 사용하는 두 가지 방법을 제안한다. 본 논문에서 제안하는 방법은 대상(target) 문서와 증거로 주어진 출처(source) 문서 사이의 상대적(relative) 정보를 추출하여 신규성을 분류할 대상 문서의 특징 벡터를 구성하는 것에 초점을 맞춘다. 본 논문에서는 표준 벤치마크 데이터 셋인 TAP-DLND 1.0를 이용하여 여러 실험을 통해서 제안한 방법의 우수성을 보여준다.
With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel documents by discarding documents sharing redundant information already seen. A recent work proposed a convolutional neural network (CNN)-based novelty detection model with significant performance improvements. We observed that it has a restriction of using document-level information in determining novelty but assumed that the document-level information is more important. As a solution, this paper proposed two methods of effectively incorporating document-level information using a CNN-based novelty detection model. Our methods focus on constructing a feature vector of a target document to be classified by extracting relative information between the target document and source documents given as evidence. A series of experiments showed the superiority of our methods on a standard benchmark collection, TAP-DLND 1.0. | 
    
|---|---|
| AbstractList | 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한 해결책으로, 본 논문에서는 합성곱신경망 기반 신규성 탐지 모델 구조를 개선하여 문서 수준 정보를 효과적으로 사용하는 두 가지 방법을 제안한다. 본 논문에서 제안하는 방법은 대상(target) 문서와 증거로 주어진 출처(source) 문서 사이의 상대적(relative) 정보를 추출하여 신규성을 분류할 대상 문서의 특징 벡터를 구성하는 것에 초점을 맞춘다. 본 논문에서는 표준 벤치마크 데이터 셋인 TAP-DLND 1.0를 이용하여 여러 실험을 통해서 제안한 방법의 우수성을 보여준다.
With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel documents by discarding documents sharing redundant information already seen. A recent work proposed a convolutional neural network (CNN)-based novelty detection model with significant performance improvements. We observed that it has a restriction of using document-level information in determining novelty but assumed that the document-level information is more important. As a solution, this paper proposed two methods of effectively incorporating document-level information using a CNN-based novelty detection model. Our methods focus on constructing a feature vector of a target document to be classified by extracting relative information between the target document and source documents given as evidence. A series of experiments showed the superiority of our methods on a standard benchmark collection, TAP-DLND 1.0. With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel documents by discarding documents sharing redundant information already seen. A recent work proposed a convolutional neural network (CNN)-based novelty detection model with significant performance improvements. We observed that it has a restriction of using document-level information in determining novelty but assumed that the document-level information is more important. As a solution, this paper proposed two methods of effectively incorporating document-level information using a CNN-based novelty detection model. Our methods focus on constructing a feature vector of a target document to be classified by extracting relative information between the target document and source documents given as evidence. A series of experiments showed the superiority of our methods on a standard benchmark collection, TAP-DLND 1.0. 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성 탐지(novelty detection)가 중요해졌다. 최근 연구에서는 합성곱 신경망(CNN) 구조 기반의 신규성 탐지 모델 구조가 제안되었고 상당한 성능 향상을 나타내였다. 본 논문에서는 기존의 CNN 기반의 모델에서 문서 수준의 정보가 제한적으로 사용되는 것을 관측하고 문서의 신규성을 결정할 때 문서 수준의 정보가 중요하므로 제한적인 사용이 문제가 된다고 가정하였다. 이에 대한 해결책으로, 본 논문에서는 합성곱 신경망 기반 신규성 탐지 모델 구조를 개선하여 문서 수준 정보를 효과적으로 사용하는 두 가지 방법을 제안한다. 본 논문에서 제안하는 방법은 대상(target) 문서와 증거로 주어진 출처(source) 문서 사이의 상대적(relative) 정보를 추출하여 신규성을 분류할 대상 문서의 특징 벡터를 구성하는 것에 초점을 맞춘다. 본 논문에서는 표준 벤치마크 데이터 셋인 TAP-DLND 1.0를 이용하여 여러 실험을 통해서 제안한 방법의 우수성을 보여준다.  | 
    
| Author | Seonho Kim Sanghun Im Heung-seon Oh 조성웅 오흥선 Seongung Jo 임상훈 김선호  | 
    
| Author_xml | – sequence: 1 fullname: 조성웅 – sequence: 2 fullname: Seongung Jo – sequence: 3 fullname: 오흥선 – sequence: 4 fullname: Heung-seon Oh – sequence: 5 fullname: 임상훈 – sequence: 6 fullname: Sanghun Im – sequence: 7 fullname: 김선호 – sequence: 8 fullname: Seonho Kim  | 
    
| BookMark | eNo9j0tLAlEAhe_CIDN_QZu7aTlw34-lSG_BjfvpOs7AoFk4bdoZuQjatBFEHHBRmNBCU8iF_aGZO_-hoaLVgY_vHDh7oNC97voFUCRESYcrjXdBOYrCJsKEMUGwKoLLbPyWrLZ2em_jDUzfN3YwgfZxZF_6Nh5BOx2mq3X6uoU2XtvxPBtOYDac28EyWS2hfZomH1_pLIbJZpEuRj-NnH1OcgFmD8921t8HO4HpRH75L0ugcXzUqJ46tfrJWbVSc9ocIcdIJoWiXAitOcUSBV5TMyo1MxQb4yEvCITX5IwoP-een38wUiGNSIu3tKYlcPg72w6j29DttqKOe165qBNEEMWMK4Go5Cj3Dv69yL3phVemd-dSRbEign4DgBB19Q | 
    
| ContentType | Journal Article | 
    
| DBID | HZB Q5X JDI  | 
    
| DEWEY | 004 | 
    
| DatabaseName | 한국학술정보 KISS Korean Studies Information Service System (KISS) B-Type [Open Access] KoreaScience  | 
    
| DatabaseTitleList | |
| DeliveryMethod | fulltext_linktorsrc | 
    
| Discipline | Computer Science | 
    
| DocumentTitleAlternate | 효과적인 문서 수준의 정보를 이용한 합성곱 신경망 기반의 신규성 탐지 | 
    
| EndPage | 238 | 
    
| ExternalDocumentID | JAKO202031458603750 3831826  | 
    
| GroupedDBID | ALMA_UNASSIGNED_HOLDINGS HZB Q5X .UV JDI  | 
    
| ID | FETCH-LOGICAL-k500-a7476835669953170fcb943794a31aac0cff6cb5428e943ceb01a780902d5d993 | 
    
| ISSN | 2287-5891 | 
    
| IngestDate | Fri Dec 22 11:59:35 EST 2023 Tue Oct 14 02:11:12 EDT 2025  | 
    
| IsOpenAccess | true | 
    
| IsPeerReviewed | false | 
    
| IsScholarly | false | 
    
| Issue | 10 | 
    
| Language | Korean | 
    
| LinkModel | OpenURL | 
    
| MergedId | FETCHMERGED-LOGICAL-k500-a7476835669953170fcb943794a31aac0cff6cb5428e943ceb01a780902d5d993 | 
    
| Notes | Korea Information Processing Society KISTI1.1003/JNL.JAKO202031458603750  | 
    
| OpenAccessLink | http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO202031458603750&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 | 
    
| PageCount | 8 | 
    
| ParticipantIDs | kisti_ndsl_JAKO202031458603750 kiss_primary_3831826  | 
    
| PublicationCentury | 2000 | 
    
| PublicationDate | 20201031 | 
    
| PublicationDateYYYYMMDD | 2020-10-31 | 
    
| PublicationDate_xml | – month: 10 year: 2020 text: 20201031 day: 31  | 
    
| PublicationDecade | 2020 | 
    
| PublicationTitle | 정보처리학회논문지. KIPS transactions on computer and communication systems 컴퓨터 및 통신 시스템 | 
    
| PublicationTitleAlternate | 정보처리학회논문지. 컴퓨터 및 통신시스템(KTCCS) | 
    
| PublicationYear | 2020 | 
    
| Publisher | 한국정보처리학회 | 
    
| Publisher_xml | – name: 한국정보처리학회 | 
    
| SSID | ssib012446218 ssib044742767 ssib013223550 ssib014210004 ssib058467651 ssib053377452  | 
    
| Score | 1.7506754 | 
    
| Snippet | 웹 상에 수 많은 문서가 등장함에 따라 기존 문서와 내용이 중복되는 문서를 찾아서 제외함으로써 새로운 문서를 찾는 노력을 줄일 수 있어 문서 수준의 신규성... With a large number of documents appearing on the web, document-level novelty detection has become important since it can reduce the efforts of finding novel...  | 
    
| SourceID | kisti kiss  | 
    
| SourceType | Open Access Repository Publisher  | 
    
| StartPage | 231 | 
    
| SubjectTerms | CNN Deep Learning Novelty Detection 딥 러닝 신규성 탐지 합성곱 신경망  | 
    
| Title | 효과적인 문서 수준의 정보를 이용한 합성곱 신경망 기반의 신규성 탐지 | 
    
| URI | https://kiss.kstudy.com/ExternalLink/Ar?key=3831826 http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO202031458603750&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01  | 
    
| Volume | 9 | 
    
| hasFullText | 1 | 
    
| inHoldings | 1 | 
    
| isFullTextHit | |
| isPrint | |
| journalDatabaseRights | – providerCode: PRVHPJ databaseName: ROAD: Directory of Open Access Scholarly Resources issn: 2287-5891 databaseCode: M~E dateStart: 20120101 customDbUrl: isFulltext: true dateEnd: 99991231 titleUrlDefault: https://road.issn.org omitProxy: true ssIdentifier: ssib044742767 providerName: ISSN International Centre  | 
    
| link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR3LThRBcAKcvPhCIz7IHOzTZsk8ema6jzOzSxCCmogJt3V2dicxEDACFw8GIwcTL15ICGETDhok8QBCIgf8od1Zv8Gqmp6HhsTHZdJbU11dj-ntqn6Vpt13PYObCV45K5OozjsO9Ll2F9fg3cRpG5HtRngaef6hO_OUzy46iyOjPyq7ljbW21PxqwvPlfyPVQEGdsVTsv9g2YIoAKAM9oUnWBief2Vj1mww6TNfsKbPApsFIWuGzDfAPcSCbLBA1FgzYH4IJQQJzmRYo5JgkkA-x90OGboUNUVBOlgPaXIi4ADxWk6UUwEalsSBk9GkEoKomcDMmTKz9gIkiyCLBQ2i6QGxGoEECwxqz1BMlbyU9QA9LIhTe8JmklgHUlmmptzPvkiKEJtG8kDRRZUo3qVSowjxlXBIjRWdEfGp2tyDx08wo0aeXp3WWWKVFCM_HlgetlF3ZK-REEFAHEAzNlmrQUIYNSWzmM7EcVngFDLn0iuhfTQUIqG2825C7JmkvELpoDyUoooCQmeVQa2-o3B94xeUJsLwjU1fT4OoiBIFDCDVh0KVCQXsJqrzRpZRGXBpeLEgVq5jTsnqWCirXd6oDmyqalf9EqX_kO-Z-M2tKDZ7zvpzj5AB2-SOcDHnsjGqjdom5huZf93M__3R0XSt0lPCaRJwhovRxOQWrkUVowfnHre80nmGuAVCGUqxVYgGfhaEYWsQeGI09rziOS5c1S6rkE_3s_57TRtZWr2uXcnTqehqdB3Xng13P_dPztP9N2nvTB98OUu39vT03U76cTPt7ejp_vbg5HTw6VxPe6fp7uFwe08fbh-mW8f9k2M9fb_f__p9cNDT-2dHg6MdqgGwb3uAoA_ffkgPNm9oC9PNhXCmrhKg1Jccw6hHEOq7ECG5rpQwVHpGErcl3h_KI9uMotiIk8SN2w63RBfgcReUFHkCd1p3nA4EHje1sZXVle4tTcdZAysRsZ10wAo8Em0P9GOBM594uFoxoY2jolovsituWrawceJhQpskxbVWOmvLrQsMeftPCHe0S-XHd1cbW3-50b0Hbvx6e5Ks_xNHlsMe | 
    
| linkProvider | ISSN International Centre | 
    
| openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%ED%9A%A8%EA%B3%BC%EC%A0%81%EC%9D%B8+%EB%AC%B8%EC%84%9C+%EC%88%98%EC%A4%80%EC%9D%98+%EC%A0%95%EB%B3%B4%EB%A5%BC+%EC%9D%B4%EC%9A%A9%ED%95%9C+%ED%95%A9%EC%84%B1%EA%B3%B1+%EC%8B%A0%EA%B2%BD%EB%A7%9D+%EA%B8%B0%EB%B0%98%EC%9D%98+%EC%8B%A0%EA%B7%9C%EC%84%B1+%ED%83%90%EC%A7%80&rft.jtitle=%EC%A0%95%EB%B3%B4%EC%B2%98%EB%A6%AC%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80.+KIPS+transactions+on+computer+and+communication+systems+%EC%BB%B4%ED%93%A8%ED%84%B0+%EB%B0%8F+%ED%86%B5%EC%8B%A0+%EC%8B%9C%EC%8A%A4%ED%85%9C&rft.au=%EC%A1%B0%EC%84%B1%EC%9B%85&rft.au=%EC%98%A4%ED%9D%A5%EC%84%A0&rft.au=%EC%9E%84%EC%83%81%ED%9B%88&rft.au=%EA%B9%80%EC%84%A0%ED%98%B8&rft.date=2020-10-31&rft.issn=2287-5891&rft.volume=9&rft.issue=10&rft.spage=231&rft.epage=238&rft.externalDBID=n%2Fa&rft.externalDocID=JAKO202031458603750 | 
    
| thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2287-5891&client=summon | 
    
| thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2287-5891&client=summon | 
    
| thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2287-5891&client=summon |