NLP · 深度学习 · 情感分析

读懂每一句 用户心声。

基于 BERT 的中文电商评论情感分析系统,
从 1,253 条真实评论中提炼商业洞察。

85% 准确率
0.84 F1 Score
3 情感分类
★★★★★

质量非常好,物超所值!

正面
★★★☆☆

一般般吧,没什么特别的

中性
★☆☆☆☆

太差了,完全不值这个价

负面

用 AI 理解
用户评价的本质。

本项目利用预训练语言模型 BERT 对电商评论进行细粒度情感分析。 将用户的一句话评论,自动归类为正面、中性或负面三种情感, 帮助商家快速洞察产品口碑,辅助商业决策。

真实数据

基于 10,000 用户、1,000 商品的真实电商数据集,涵盖多品类评论场景。

预训练模型

采用 bert-base-chinese 作为基座模型,在中文语料上具备出色的语言理解能力。

端到端流程

从数据预处理到模型训练、评估、预测,完整覆盖 NLP 项目全生命周期。

数据,
是一切的起点。

0 条评论

真实用户评论数据,覆盖多种情感表达

正面
中性
负面
0 用户
0 商品
0 MB 原始数据

标签映射规则

1-2 ★
负面
3 ★
中性
4-5 ★
正面

数据文件

📄 reviews.csv 1.4 MB
📄 users.csv 1.0 MB
📄 products.csv 634 KB
📄 interactions.csv 19.3 MB
📄 sessions.csv 2.5 MB
📄 purchases.csv 464 KB

从文字到洞察,
层层递进。

以 BERT 为基座,通过微调实现中文评论的三分类任务。 模型捕捉上下文语义关系,理解"还不错"与"很差"背后的真实情感。

01

输入层

原始评论文本

"质量非常好,物超所值!"
02

Tokenizer

中文分词 + Token ID 编码

[CLS] 质量 非常 好 , 物 超 所 值 ! [SEP]
03

BERT Encoder

12 层 Transformer,768 维隐藏层

···
04

分类头

[CLS] → Dropout → Linear(768→256) → ReLU → Dropout → Linear(256→3)

768
256
3
05

输出

Softmax 概率分布

正面
92%
中性
5%
负面
3%

训练配置

预训练模型 bert-base-chinese
最大序列长度 128 tokens
批次大小 32
学习率 2e-5
训练轮数 3 epochs
权重衰减 0.01
训练集比例 80%
验证/测试 10% / 10%

数字说话。

85%
准确率 Accuracy
0.84
F1 Score
0.85
Precision
0.83
Recall

分类效果示意

预测:正面 预测:中性 预测:负面
实际:正面
极低
实际:中性
实际:负面
极低

试试看。

输入一条评论,感受模型的情感判断。

😞 负面 置信度 94.2%
正面
2.1%
中性
3.7%
负面
94.2%

试试这些例子:

代码,
井然有序。

📁 LLM_test/
📁 bert-base-chinese/ 预训练 BERT 模型 (412MB)
📁 bert_test/ 项目主代码
📁 src/
🐍 config.py 超参数配置
🐍 dataset.py PyTorch Dataset
🐍 data_loader.py 数据加载与预处理
🐍 model.py BERT + 分类头
🐍 train.py 训练循环
🐍 predict.py 推理预测
📁 data/processed/ 已划分的 train/val/test
📁 models/ best_model.pt (410MB)
📁 data_most/ 原始数据集 (6 个 CSV)