现有方面级情感分析研究大多数往往从文本数据本身进行情感分析,而没有充分利用领域知识,忽略了语义依存信息的重要性,使得方面表示受噪声信息影响严重,出现噪声词注意权重高的可能。针对以上问题,结合领域知识,提出了一种剪枝算法和语义-注意力机制相结合的方法(Pruning And Semantic At tention,PASA)针对服务领域特定方面进行情感分类。方法一方面结合领域知识对文本对应的语义依存树进行剪枝实现方面信息降噪,另一方面,通过利用语义-注意力机制进行增强并精确捕获方面的上下文描述信息,从而实现对方面情感极性的判断。为了验证所提出方法的正确性和有效性,在物流数据集、酒店评论数据集及SemEval 2014的Restaurant数据集进行了大量实验,结果表明,所提出的方法相对于其它方法具有明显优势,在垂直领域具有较好的应用前景。
针对当前社会网络图数据规模不断增加,现有匿名算法大多只考虑匿名隐私强度,忽略匿名后节点影响力变化的问题进行了研究。基于Pregel模型提出分布式保护节点影响力的匿名算法(anonymous protecting influence of nodes,APIN)。算法分解社会网络图得到k-核图,核数代表节点影响力,分裂节点匿名的同时保证原节点核数不变,从而保证节点影响力不变。为了提高APIN算法隐私保护强度,针对社区结构提出保护社区中节点影响力的社会网络匿名算法(anonymous protecting influence of nodes in community,APINC),基本思想是在社区中实现δ-shell安全分组,从而达到δ-核匿名。在真实社会网络数据实验表明,所提出的算法在保持节点影响力的同时很好地保护了图结构性质;最后展望了下一步研究方向。