作业 3
计22-1
TF我=100/1000=0.1TF爱=80/1000=0.08
IDF我=log(语料库文档总数/包含该词的文档数)=log(10,000,000/100,000)≈log(100)≈2
IDF爱=log(语料库文档总数/包含该词的文档数)=log(10,000,000/10,000)≈log(1000)≈3
TF−IDF我=TF我∗IDF我=0.1∗2=0.2TF−IDF爱=TF爱∗IDF爱=0.08∗3=0.24
"我" 的 TF-IDF 值为 0.2,词 "爱" 的 TF-IDF 值为 0.24。关键词是 TF-IDF 值更高的 "爱"。