python用户评论标签匹配的解决方法

所属分类: 脚本专栏 / python 阅读数: 1721
收藏 0 赞 0 分享

我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述属性时表达情感,属性是情感表达的对象。还发现:属性词和专用情感词基本都是名词或形容词(形谓词)。

算法流程图如下:

评论数据如下:

代码如下:

#encoding=utf-8 
 
############################# 
# 
# 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。 
# 
# @author:licl 
# 
############################## 
 
fdata = open('JD_DFB_comments_out.txt','r') 
Output = open('Pattern_Result.txt','a') 
 
try: 
 data = fdata.readlines() 
  
 listline = [] 
  
  
 for line in data: 
   
  listline = line.replace(" ","/") 
  listline = listline.split("/") 
   
  i = 1 
   
  while i < len(listline): 
    
   if listline[i] != "名词": 
     
    i = i+2 
     
   else: 
     
    new_list = ["","",""] 
    new_list[0] = listline[i-1] 
     
    a = i-1 
    i = i+2 
     
    while i < len(listline):     
      
     if listline[i] == "标点": 
       
      i = i+2 
      break 
      
     else: 
       
      if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
       new_list[1] = listline[i-1] 
      if listline[i] == "形容词" or listline[i] == "形谓词": 
       new_list[1] += listline[i-1] 
        
       b = i-1     
       t = (b-a)/2   
       new_list[2] = str(t) 
       for line in new_list: 
         
        Output.write(line + " ") 
         
       Output.write("\n")  
       break 
       
      else: 
      
       i = i+2  
except: 
 print "‘文件不存在'或者‘文件无法打开'" 
   
finally: 
  
 fdata.close() 
 Output.close() 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

更多精彩内容其他人还在看

Python常见加密模块用法分析【MD5,sha,crypt模块】

这篇文章主要介绍了Python常见加密模块用法,结合实例形式较为详细的分析了MD5,sha与crypt模块加密的相关实现方法与操作技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

Python向日志输出中添加上下文信息

这篇文章主要介绍了Python向日志输出中添加上下文信息的方法,非常不错,具有参考借鉴价值,需要的朋友可以参考下
收藏 0 赞 0 分享

Python实现的简单dns查询功能示例

这篇文章主要介绍了Python实现的简单dns查询功能,结合实例形式分析了Python基于socket模块的dns信息查询实现技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

利用Anaconda完美解决Python 2与python 3的共存问题

Anaconda 是 Python 的一个发行版,如果把 Python 比作 Linux,那么 Anancoda 就是 CentOS 或者 Ubuntu,下面这篇文章主要给大家介绍了利用Anaconda完美解决Python 2与python 3共存问题的相关资料,文中介绍的非常详
收藏 0 赞 0 分享

Python随机读取文件实现实例

这篇文章主要介绍了Python随机读取文件的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

用生成器来改写直接返回列表的函数方法

下面小编就为大家带来一篇用生成器来改写直接返回列表的函数方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

python爬虫入门教程--快速理解HTTP协议(一)

http协议是互联网里面最重要,最基础的协议之一,我们的爬虫需要经常和http协议打交道。下面这篇文章主要给大家介绍了关于python爬虫入门之快速理解HTTP协议的相关资料,文中介绍的非常详细,需要的朋友可以参考借鉴,下面来一起看看吧。
收藏 0 赞 0 分享

老生常谈Python进阶之装饰器

下面小编就为大家带来一篇老生常谈Python进阶之装饰器。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

浅谈Python基础之I/O模型

下面小编就为大家带来一篇浅谈Python基础之I/O模型。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

python如何获取服务器硬件信息

这篇文章主要为大家详细介绍了python获取服务器硬件信息的相关代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享
查看更多