의짱의 공부 일지

의짱의 공부 일지

  • 분류 전체보기 (14)
    • Computer Science (6)
      • 컴퓨터 구조 (5)
      • 운영체제 (0)
      • 네트워크 (0)
      • 자료구조 (0)
      • 알고리즘 (0)
    • 프로그래밍 언어 (0)
      • Python (1)
      • C++ (0)
      • C (0)
    • 임베디드 (0)
      • 라즈베리파이 (0)
      • Firmware (0)
    • AI (1)
      • 데이터 (0)
      • 머신러닝 (0)
      • 딥러닝 (0)
      • Time Series (0)
      • Computer Vision (0)
      • 자연어 처리 (1)
      • Kaggle Competition (0)
    • 프로젝트 (4)
    • 코딩테스트 (1)
    • 독서 (0)
  • 홈
RSS 피드
로그인
로그아웃 글쓰기 관리

의짱의 공부 일지

컨텐츠 검색

태그

메모리 구조 Crawling tf-idf Cache memory 캐시 D램 block 메모리 단위 지역성 캐시메모리 Locality Instruction Cycle 명령어 사이클 S램 Cache 정보검색 컴퓨터구조 기사 크롤링 CPU 구성 요소 메모리 원리

최근글

댓글

공지사항

아카이브

AI(1)

  • [자연어 처리] 정보 검색 / TF-IDF

    1) TF-IDF란 Term Frequency - Inverse Document Frequency 의 약자로 하나의 문서에서 키워드를 추출하는 방법이다. 키워드를 추출하면 문서의 전체 내용을 단어들로 요약할 수 있다. 2) 왜 필요해? 자연어를 처리하기 위해선 컴퓨터가 이해할 수 있도록 숫자로의 변환과정이 필요하다. 비교적 유연한 문장의 구조를 그대로 변환하는 것보단, 문장에 포함된 단어들을 기준으로 하는 것이 훨씬 유리할 것이다. 문장에는 불용어(the, a, in, on 등) 같은 필요하지 않는 내용들도 모두 포함하고 있기 때문이다. 따라서, 키워드를 추출해야 그 문장을 잘 설명할 수 있는 숫자로 변환할 수 있다. 3) 어떻게 키워드를 추출해? TF : 해당 문서의 특정 단어의 빈도 DF : 그 단어..

    2024.04.16
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바