전체 글(14)
-
Computer Science
미사일의 움직임을 정확하게 계산해내기 위해서 최초의 컴퓨터 '애니악'이 개발되었습니다. '애니악'의 크기는 집채만 했는데, 진공관을 주 부품으로 사용했기 때문입니다. 컴퓨터는 0 과 1로 모든 것을 이해하고 표현합니다. 당시에는 0과 1을 표현하는 단위 부품이 진공관이었지만, 현재는 트랜지스터가 개발되어 크기가 획기적으로 작아짐에 따라 개인용 컴퓨터가 등장하게 되었습니다. 효율적인 SW를 개발하기 위해선 컴퓨터에 대해 알아야합니다. 컴퓨터 구조와 운영체제, 그리고 네트워크가 무엇인지 알아보고 컴퓨터에 대해 이해해보는 시간을 가져보겠습니다. 그리고 이를 SW 개발에 어떻게 활용할 수 있을 지도 함께 고민해보겠습니다.
2024.04.17 -
[자연어 처리] 정보 검색 / TF-IDF
1) TF-IDF란 Term Frequency - Inverse Document Frequency 의 약자로 하나의 문서에서 키워드를 추출하는 방법이다. 키워드를 추출하면 문서의 전체 내용을 단어들로 요약할 수 있다. 2) 왜 필요해? 자연어를 처리하기 위해선 컴퓨터가 이해할 수 있도록 숫자로의 변환과정이 필요하다. 비교적 유연한 문장의 구조를 그대로 변환하는 것보단, 문장에 포함된 단어들을 기준으로 하는 것이 훨씬 유리할 것이다. 문장에는 불용어(the, a, in, on 등) 같은 필요하지 않는 내용들도 모두 포함하고 있기 때문이다. 따라서, 키워드를 추출해야 그 문장을 잘 설명할 수 있는 숫자로 변환할 수 있다. 3) 어떻게 키워드를 추출해? TF : 해당 문서의 특정 단어의 빈도 DF : 그 단어..
2024.04.16