星星_品职助教 · 2020年02月04日
同学你好,
其实无论哪种衡量方法,最终都需要结合题干的具体描述才能得出结论。因为词频大,既有可能是无用的停止词,也有可能就是因为这个词重要所以才出现的多,需要结合其他信息才能给出最终的结果。
ladycoco想放假 · 2020年02月04日
也就是说,DF大也不一定是不重要的词?那IDF小也不一定是不重要的词咯?这跟老师说的IDF越大越重要好像矛盾了
星星_品职助教 · 2020年02月04日
正常的规律是如果DF太高,说明文本中几乎每句话都有这个单词。这个单词也就反而没有了区分度。但是要结合实际的题目背景,看题干里有没有设置陷阱