黄宇 作品数:32 被引量:134 H指数:6 供职机构: 中国科学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 天文地球 环境科学与工程 电子电信 更多>>
一种利用语义相似特征提升细粒度情感分析方法 被引量:4 2017年 情感分析主要研究人们正面或负面情感的表达。随着网页文本的爆炸式增长,情感分析在学术研究和实际应用中都成了热门话题。细粒度的情感分析方法通常采用两步策略,从而极易产生自底向上的层叠错误问题。为了解决这个问题,研究者们提出了一种基于马尔科夫逻辑的细粒度的情感分析联合框架。其中最常用的传统全局特征是自底向上和自顶向下特征。为了更好地提升细粒度情感分析的联合学习能力,一种新的语义相似特征被提了出来,中文情感分析数据集上的实验证明,此特征能对情感分析联合框架带来极大的改进。 陈自岩 黄宇 王洋 傅兴玉 付琨一种基于用户兴趣的微博实体链接方法 被引量:1 2016年 针对微博内容较短、歧义较大的问题,利用概率主题模型对用户的兴趣进行建模,提出了一种基于用户兴趣的微博实体链接方法。具体地,利用现有的主题模型从知识库的大量数据中训练实体与上下文词汇的语义关联,提出用户兴趣主题模型来建模用户对实体的兴趣以及微博的语义,并完成实体链接的任务。此外,在真实数据集上进行了大量实验和分析,取得了87.6%的实体链接准确率,实验结果表明,与现有方法相比,该方法通过用户兴趣的建模更好地刻画了微博的语义,因而也取得了更高的实体链接准确率。 宋俊 李禹恒 黄宇 陈昊 付琨关键词:自然语言理解 用户兴趣建模 活性炭吸附苯系物性能的研究进展 被引量:1 2024年 人类活动排放的挥发性有机物(VOCs),尤其是苯系物(BTEX),不仅影响空气质量,还会对人体健康产生不同程度的危害。室内苯系物具有浓度低、释放周期长及来源复杂等特点。由于活性炭(AC)优异的孔道结构和易调控的表面化学性质,采用活性炭吸附苯系物是封闭/半封闭空间空气污染控制的最有效策略之一。本文综述了封闭/半封闭空间苯系物的理化特征、活性炭的物理化学性质及其吸附苯系物的影响因素。这些因素主要包括活性炭物理结构、表面化学性质、苯系物分子结构和吸附条件。此外,还进一步探讨了活性炭再生技术,并展望了针对封闭/半封闭空间苯系物污染的活性炭吸附技术的改进策略。 张超锋 张超锋 石先进 李荣关键词:活性炭 苯系物 一种海量遥感数据分类组织方法 本发明提供了一种海量遥感数据分类组织方法,根据各遥感数据的空间信息和时间信息,将海量遥感数据划分为多个数据集合,根据每个数据集合中的数据特征,对每个数据集合中遥感数据进行层级聚类,从而对遥感数据进行分类。本发明根据数据自... 付琨 许光銮 孙显 王磊 黄宇 李峰 张利利文献传递 一种面向实体的演化式多文档摘要生成方法 被引量:2 2015年 本文针对多文档摘要没有考虑实体、仅仅生成通用摘要的问题,提出面向实体的演化式多文档摘要生成方法。本文首先利用一个概率主题模型联合建模文档主题的演化和实体的参与情况,然后结合实体对句子进行评分和选择,针对不同的实体,同一个句子可能获得不同的评分。此外,本文在真实数据集上进行了大量的实验和分析,实验结果表明,该方法可以面向不同的实体生成关于事件发展的个性化摘要,同时与现有方法相比,该方法还得到了更好的通用摘要。 宋俊 韩啸宇 黄宇 黄廷磊 付琨关键词:多文档摘要 自然语言处理 基于概率的复杂目标图像语义推理模型 被引量:4 2009年 结合本体技术语义表达的优势和Bag Of Words模型的复杂目标图像建模的优势,将复杂目标本体中的本体概念作为随机变量引入到Bag Of Words模型中,提出了基于本体的复杂目标语义推理模型,建立了本体概念同图像的映射关系。通过本体概念在语义网中的推理,得到图像更深层次的语义推理结论,并通过实验验证了此模型的有效性。 黄宇 付琨 吴一戎 詹芊芊关键词:SIFT描述子 本体概念 BAG 语义推理 一种基于遥感数据的热点主题展示方法 本发明提供了一种基于遥感数据的热点主题展示方法,首先从遥感数据中提取出事件元素,然后根据事件元素对事件进行分层聚类,得到分布在不同层次的事件聚类,再对各个层次的热点主题进行统计分析,得到热点主题的分布形态,最后对热点主题... 付琨 许光銮 孙显 黄宇 王磊 闫梦龙 郑歆慰文献传递 钙钛矿催化剂用于氨选择性还原氮氧化物的研究进展 被引量:4 2020年 氨选择性催化还原氮氧化物(NOx)技术是目前应用较为广泛的催化脱硝技术,钙钛矿材料因其独特的结构、良好的稳定性且环保无害的特点成为选择性催化还原NOx领域的研究热点。本文综述了近年来国内外关于钙钛矿NH3-SCR催化剂的研究进展,较为全面地对钙钛矿催化剂的主要类型、脱硝活性、构效关系进行了论述,同时介绍了钙钛矿在光辅助SCR技术这一全新领域的研究进展,并总结了钙钛矿催化剂的NH3-SCR反应机制,对该领域未来可能的发展方向和研究目标进行了展望。 拓凯 张朋 张朋 王利关键词:钙钛矿 催化剂 脱硝活性 大气污染控制 基于低秩分解的精细文本挖掘方法 被引量:2 2014年 全文检索等应用要求对文本进行精细表示。针对传统主题模型只能挖掘文本的主题背景,无法对文本的侧重点进行精细描述的问题,提出一种低秩稀疏文本表示模型,将文本表示分为低秩和稀疏两部分,低秩部分代表主题背景,稀疏部分则是对主题中不同方面的关键词描述。为了实现文本低秩部分和稀疏部分的分解,定义了主题矩阵,并引入鲁棒性主成分分析(PCA)方法进行矩阵分解。在新闻语料数据集上的实验结果表明,模型复杂度比隐含狄利克雷分配(LDA)模型降低了25%。在实际应用中,将模型所得的低秩部分应用于文本分类,分类所需的特征减少了28.7%,能用于特征集的降维;将稀疏部分应用于全文检索,检索结果精确度比LDA模型提高了10.8%,有助于检索结果命中率的优化。 黄晓海 郭智 黄宇关键词:文本挖掘 主题背景 关键词 一种基于分布式多中心的资源共享系统及方法 本发明公开了一种基于分布式多中心的资源共享系统及方法,物理层提供系统存储和计算的硬件服务,分布式集群提供分布式存储和分布式计算能力,确保内部数据迁移以及外部的安全分发;资源层是集分布式文件存储系统、分布式数据库系统、关系... 许光銮 付琨 黄宇 郭智 李磊 张万层 陈丽勇文献传递