

老师好
1) 是否在text cleansing的时候(截图1)的顺序matters,所以一定要按这里的顺序来做(先remove htlm, 再remove or replace punctuations, then replace numbers with/Numbre/ 最后remove white spaces),但是在做text processing 的时候的顺序可以不按截图2这里的1,2,3,4 来?
2) 在text cleansing的时候(截图1)中第三步punctuation是 要用/number/代替 而不是“remove number or 用/number/代替”,是吗?谢谢。