文本数据属于非结构化数据,数据信息更为复杂,具有不规则、不完整性特征,无法通过既定的数据模型直接分析。需要将文本数据进行预处理,输出可以应用数据库二位逻辑表来表现的数据。
文本数据的来源很多,例如微博、小红书、知乎、淘宝、论坛、视频网站等等。在电商领域,本文数据来源主要来自电商直播的聊天窗口、客服咨询界面、产品售后评价等。分析方法主要为文本数据预处理,提炼出主要分析维度和细分维度,匹配维度下的关键词,输出各维度的词频和转化率,挖掘用户观点,发现产品机会点。
© 版权声明
文章版权归三青资源所有,未经允许请勿转载。
THE END