NLP · 深度学习 · 情感分析

读懂每一句用户心声。

基于 BERT 的中文电商评论情感分析系统，
从 1,253 条真实评论中提炼商业洞察。

85% 准确率

0.84 F1 Score

3 情感分类

★★★★★

质量非常好，物超所值！

正面

★★★☆☆

一般般吧，没什么特别的

中性

★☆☆☆☆

太差了，完全不值这个价

负面

项目概览

用 AI 理解
用户评价的本质。

本项目利用预训练语言模型 BERT 对电商评论进行细粒度情感分析。将用户的一句话评论，自动归类为正面、中性或负面三种情感，帮助商家快速洞察产品口碑，辅助商业决策。

真实数据

基于 10,000 用户、1,000 商品的真实电商数据集，涵盖多品类评论场景。

预训练模型

采用 bert-base-chinese 作为基座模型，在中文语料上具备出色的语言理解能力。

端到端流程

从数据预处理到模型训练、评估、预测，完整覆盖 NLP 项目全生命周期。

数据集

数据，
是一切的起点。

0 条评论

真实用户评论数据，覆盖多种情感表达

正面

中性

负面

0 用户

0 商品

0 MB 原始数据

标签映射规则

1-2 ★

→

负面

3 ★

→

中性

4-5 ★

→

正面

数据文件

📄 reviews.csv 1.4 MB

📄 users.csv 1.0 MB

📄 products.csv 634 KB

📄 interactions.csv 19.3 MB

📄 sessions.csv 2.5 MB

📄 purchases.csv 464 KB

模型架构

从文字到洞察，
层层递进。

以 BERT 为基座，通过微调实现中文评论的三分类任务。模型捕捉上下文语义关系，理解"还不错"与"很差"背后的真实情感。

输入层

原始评论文本

"质量非常好，物超所值！"

Tokenizer

中文分词 + Token ID 编码

[CLS] 质量非常好，物超所值！ [SEP]

BERT Encoder

12 层 Transformer，768 维隐藏层

···

分类头

[CLS] → Dropout → Linear(768→256) → ReLU → Dropout → Linear(256→3)

768

→

256

→

输出

Softmax 概率分布

正面

92%

中性

负面

训练配置

预训练模型 bert-base-chinese

最大序列长度 128 tokens

批次大小 32

学习率 2e-5

训练轮数 3 epochs

权重衰减 0.01

训练集比例 80%

验证/测试 10% / 10%

模型效果

数字说话。

85%

准确率 Accuracy

0.84

F1 Score

0.85

Precision

0.83

Recall

分类效果示意

预测：正面预测：中性预测：负面

实际：正面

高

低

极低

实际：中性

低

中

低

实际：负面

极低

低

高

交互演示

试试看。

输入一条评论，感受模型的情感判断。

😞 负面置信度 94.2%

正面

2.1%

中性

3.7%

负面

94.2%

试试这些例子：

项目结构

代码，
井然有序。

📁 LLM_test/

📁 bert-base-chinese/ 预训练 BERT 模型 (412MB)

📁 bert_test/ 项目主代码

📁 src/

🐍 config.py 超参数配置

🐍 dataset.py PyTorch Dataset

🐍 data_loader.py 数据加载与预处理

🐍 model.py BERT + 分类头

🐍 train.py 训练循环

🐍 predict.py 推理预测

📁 data/processed/ 已划分的 train/val/test

📁 models/ best_model.pt (410MB)

📁 data_most/ 原始数据集 (6 个 CSV)

读懂每一句 用户心声。

用 AI 理解用户评价的本质。