参考
数据集:https://github.com/aespresso/chinese_sentiment
1. 处理
1.1. 统一序列的维度
处理文本序列时,维度必须统一。文本A分词之后有200个token,文本B分词之后有1000个token,你必须统一成一个维度,例如限定序列长度是500。文本A不到500个token,用0填充,文本B就截取一部分
1 | # 求出所有序列的长度 |
2. 代码
1 | """ |
参考
数据集:https://github.com/aespresso/chinese_sentiment
处理文本序列时,维度必须统一。文本A分词之后有200个token,文本B分词之后有1000个token,你必须统一成一个维度,例如限定序列长度是500。文本A不到500个token,用0填充,文本B就截取一部分
1 | # 求出所有序列的长度 |
1 | """ |
微信支付
支付宝