

这两道题的干扰性很强,基本每次做都会错。听课的时候就听的云里雾里的,老师有没有好的记忆方法
pzqa38 · 2024年09月27日
嗨,从没放弃的小努力你好:
词干提取(Stemming)。根据一些规则,例如去掉复数,过去式,进行时等,将单词转化为它的原始词根形式,例如,“analyzed”和“analyzing”在处理前会显示为两个标记,但无论是过去式的“ed”形式还是进行时的“ing”形式,其实表示的都是同样的特征。提取词干后,它们的词干都为“analyz”,也就转化为了同一个特征。
词形还原(Lemmatization)。词形还原与词干提取类似,但这种方法还原后的词形仍是一个完整的单词。如“analyzed”和“analyzing”的词形还原都为“analyze”。而词干提取后的结果是“analyz”,没有最后的“e“。
----------------------------------------------努力的时光都是限量版,加油!