开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

Feeling · 2020年01月30日

TF in collective level &TF in sentence level & DF

老师看下这样理解是否正确~


前提:词 组成 句子 组成 文本 组成 总文本

TF in collective level 是词在文本中句子里出现的次数除以文本的总句子次数,越多代表对于区分这一句子没有帮助词。

TF in sentence level 是词在某句子中出现的次数除以该句子的总词数,越多代表这个词对于这个句子越重要。

DF是有某词的文本数除以总文本数,越多代表越不能把此文本与其他文本分开。IDF和DF成反向关系。

TF-IDF高说明,某词在文本中出现的少,但是出现时频次却很高,因此是一个可区分、独特的词。

1 个答案
已采纳答案

星星_品职助教 · 2020年02月04日

同学你好,

总结的都没问题。

但具体一个词是重要还是不重要,还要再去参考一下题干中的具体说法,因为有的时候词出现的很多,既可能是无用的停止词,也可能就是这个词有用所以才多,所以要结合实际的题干下最终结论。

  • 1

    回答
  • 0

    关注
  • 322

    浏览
相关问题