本课题组在研和完成的科研项目(国家级)
以用户为中心的情绪诱导对话生成关键技术研究,国家自然科学基金,62272092,2023.1~2026.12
基于对话系统实现人机之间的情感交互是当前人工智能领域的研究热点。现有的情绪对话生成技术研究工作主要以系统为中心,无法充分结合用户个性与对话情境,对用户的情绪状态实施主动的影响。基于此,本课题提出以用户为中心的情绪诱导对话生成这一崭新的研究问题,并开展以下研究:⑴ 数据集构建与外部知识重构技术,解决课题的语料库与知识库储备问题;⑵ 用户个性与对话情境建模技术,解决人机交互中用户个性与对话情境识别问题;⑶ 人机情感交互推理技术,解决用户被诱导情绪状态预测问题;⑷ 情绪诱导对话回复生成技术,解决单轮、多轮、多模态等不同场景下情绪诱导对话生成问题;⑸ 内容安全检测与对话质量评估技术,解决训练数据的内容安全与质量问题;⑹ 系统部署后情绪诱导对话生成技术,解决模型的持续学习更新问题。本课题创新性地提出赋予对话系统诱发与调节用户情绪状态这一能力,研究成果在聊天机器人的情感陪伴、心理疏导等方面具有广阔的应用前景。
情绪感知的可解释对话生成技术研究,国家自然科学基金,62172086,2022.1~2025.12
人机双方在对话系统中的“情感交互”对于机器人的情感陪伴、心理疏导等服务具有重要作用。由于对话生成所采用的先进技术导致其处理过程缺乏可解释性,机器人难以说服自己和说服用户,用户难以知其然、并知其所以然,因此本课题研究情绪感知的可解释性对话生成技术。包括:(1) 面向可解释模型的对话知识构建技术,解决建模所需的训练语料问题;(2) 可解释的用户话语情绪感知技术,解决机器人对用户的情绪感知问题;(3) 可解释的对话生成情绪预测技术,解决机器人与用户的共情问题;(4) 基于预测情绪的可解释对话生成技术,解决机器人给予用户的回复问题;(5) 情绪感知、对话生成结果与其解释之间关系判定准则及模型优化技术,解决模型及过程的评价和优化问题。最终将实现一个具有知识构建、对话理解、对话预测、对话生成、对话管理功能的面向人机情感交互的可解释性对话生成原型系统。达到:(1) 用户通过解释获得更好的体验;(2) 模型生成结果与其对应的解释互促进、共增强。
面向情感交互的人机对话文本生成技术研究,国家自然科学基金项目,61872074,2019.1~2022.12
使用自然语言实现人机对话是人工智能领域的研究热点。早期的对话系统“无情感、无性格”,因此,让机器拥有类似人类的情感是智能对话系统长期追求的目标之一。本课题致力于通过文本形式的人机对话,实现两者之间在情绪和观点层次上的沟通,赋予对话系统一系列新的特性,针对这些特性,研究面向情感交互的人机对话文本生成技术,包括:(1) 考虑不同用户的个性并赋予机器不同的特质,研究对话情境中用户个性和机器特质建模技术;(2) 为及时捕捉对话过程中用户情绪状态变化和用户立场,研究用户情绪与立场动态感知技术;(3) 为了生成表达指定情绪或观点的文本,研究可控的情绪与观点文本生成技术;(4) 基于上述条件,研究个性化情绪对话生成技术以及“迎合式”与“反驳式”观点对话生成技术。本课题创新性地将用户个性与机器特质因素引入到情绪对话,并提出了观点对话生成这一崭新的研究问题。研究成果在聊天机器人的情感陪伴、心理疏导等功能方面具有广阔的应用前景。
实时高精度动态学术画像构建技术,国家重点研发项目(子课题),2018YFB1004702,2018.7~2021.6
课题面向知识图谱的高精度演进学者画像,针对学者领域多样、差异较大的特征研究精确描述学者画像的建模方法,通过实时采集多维科研行为数据,运用 NSF分类法、中图法,以及知识图谱分析学术数据以便精准构建学术画像;针对学者画像中专家评估和排名的复杂性,研究基于分布式谱分析算法的评价体系,从而高效提取领域内高水平专家,完成专家全方位评估和多维度排名;针对学者画像的实时演化性,研究基于画像活化模型的动态更新规则,包括画像库的自我更新和关系图谱的动态演进;针对学者画像建模的复杂性,研究基于立体、精准、 可信的学术画像方法,包括学术同行评价方法、专家推荐方法。
基于社会媒体挖掘的多样化社交关系主动学习,国家自然科学基金项目,61772122,2018.1~2021.12
社会媒体上的社交关系学习对于搜索、推荐、社群发现等诸多应用具有重要意义。当前工作中,基于给定社交关系的应用很多,主动发现社交关系的研究较少;应用直接、显式、静态社交关系的工作较多,发现间接、隐式、动态社交关系的工作较少;检测社交关系存在与否的工作较多,学习关系语义信息的研究较少。本课题以社会媒体平台的资源和用户为数据源,从形式、语义及操作三方面定义了多样化社交关系,分析了发现多样化社交关系面临的挑战,应用社会媒体挖掘、深度学习、特别是主动学习技术,研究基于关系定义与标注的直接社交关系主动学习、面向关系语义识别的静态社交关系主动学习、面向变化规律发现的动态社交关系主动学习、面向多关系融合与精炼的关系关联性主动学习。作为研究成果,本课题将构建一个能充分表达多样化社交关系的多重图模型,因此还研究基于多重图结构的社交关系存储、更新及可视化。本课题研究成果能够很好地支持社交关系搜索等相关应用。
面向微视频情感分析的多通道特征学习关键技术研究,国家自然科学基金项目,61402091,2015.1~2017.12
微视频作为一种重要的社会媒介形式,在网络观点信息发起和传播中起着越来越重要的作用,分析其中的情感内容,挖掘其表达的观点信息,对网络监控、市场预测、个性化推荐等都具有重要意义。然而由于微视频数据的内容简短性、故事单一性、传播模态多样性以及社区相关性等特点,现有的情感分析算法尚不能很好地满足微视频情感分析的需求。基于此,本课题研究面向微视频空间情感分析的多通道特征学习关键技术。针对微视频数据的上述特点,研究实时Web 数据的情感采集技术、面向微视频空间的情感语义学习技术、基于视频情感本体的多通道特征表征模型、以及多通道特征融合的情感分析技术。结合以上技术,本研究实现一个微视频情感分析原型系统。该研究成果将为微视频情感自动分析、汇总、实时监控及个性化推荐等应用提供相关技术支持。
基于广义内容分析的社会媒体多层次资源推荐模型研究,国家自然科学基金项目,61370074,2014.1~2017.12
推荐系统包括用户兴趣分析和推荐信息选择两个主要部分,社会媒体中丰富的信息资源和不同主题的用户社群为此提供了更广阔的分析和选择空间。在基于社会媒体的推荐中,上述分析和选择需要包括视觉和听觉特征、语义信息、元数据等所有内容的分析。本课题将这些内容统称为广义内容,将社会媒体资源划分成单一、复合、综合资源及子资源,研究基于广义内容分析的社会媒体多层次资源的推荐。基础方面,研究广义内容分析方法;用户兴趣分析方面,研究用户-资源异构信息网络构建、用户社群发现及社群主题向用户兴趣模型的映射;资源选择方面,研究基于单一资源的其它层次资源挖掘、表达条件相关性的多层次资源模型构建以及资源的质量标识;模型应用方面,研究基于上述模型的资源匹配和推荐方法。这些工作既体现了本课题提出的多层次资源推荐的特点,又融合了当前社会媒体研究中注重用户关系的特点。本课题最终将基于现有主流社会媒体实现对应的原型系统表明上述特点。
面向微博客空间实时舆情监控的观点挖掘关键技术研究,国家自然科学基金项目,61100026,2012.1~2014.
12
微博客作为一种新的信息载体和传播途径,在网络舆情信息发起和传播中起着越来越重要的作用,分析其中的网络舆论,对于了解社情民意具有重要意义。然而由于微博客数据的实时性、简短性、社区性、特别是多模态性等特点,现有的观点挖掘算法尚不能很好地满足微博客舆情分析的需求。基于此,本课题研究面向微博客空间实时舆情监控的观点挖掘关键技术。针对微博客数据的上述特点,研究实时Web数据观点采集及跟踪技术、短文本的细粒度情感分析技术、微博客舆情事件意见领袖发现技术、以及面向多模态微博客数据的情感分析技术。结合以上技术,本研究实现一个微博客空间舆情监控原型系统。该研究成果将为自动分析、汇总、跟踪微博客等实时Web中舆情信息提供相关技术支持。
网络可视媒体的有效搜索与服务,国家基础研究(973)项目(子课题),2011CB302206-G,2011.1~2015.8
本课题研究多模态可视媒体数据挖掘关键技术:针对多模态信息特征的超高维性、不同模态数据的异构及特征类型的复杂性、不同模态特征对描述对象贡献的不确定性、以及同一模态的不同特征对描述对象贡献的不确定性,研究多模态特征融合模型;针对传统数据挖掘算法在多模态数据源中的不适用性,研究多模态特征融合模型基础上高效的数据挖掘算法、算法的融合及挖掘结果的融合技术。
支持网络舆情分析的观点挖掘及观点社群发现关键技术研究,国家自然科学基金项目,60973019,2010.1~2012.12
“网络舆情分析”是在当前互联网已成为社会舆论的发源地、网络舆情折射出社会热点这样的新形势下政府机构了解民意的一种新的途径。“观点挖掘”是近年来出现的一个集新闻传播、心理学等人文和社会科学以及文本挖掘、信息检索、自然语言处理等自然科学知识于一体的新的研究课题,是网络舆情自动分析的主要支撑技术之一。本课题研究支持网络舆情分析的观点挖掘关键技术,通过分析网络舆论文档,总结出网络舆论具有分布广泛、内容复杂、情感模糊、倾向时变、以及应用中的探索性需求等特点,针对之研究舆论数据的收集及事件与观点表征技术、舆论观点的聚类与分类技术、舆论文本流上观点漂移及新热点发现技术、以及观点社群及意见领袖发现技术,建立一个支持网络舆情分析的观点挖掘模型,并实现一个网络舆情浏览原型系统。该研究成果将为自动分析、汇总、跟踪网上舆情提供相关技术支持。
面向新一代搜索引擎的用户动机推演模型研究,国家自然科学基金项目,60573090,2006.1~2008.12
新一代搜索引擎具有互动式搜索、分类导航、查询精确相关及更新速度快等特点,是目前搜索引擎的发展方向。先进的用户模型对于搜索引擎功能的实现具有重要作用,准确理解用户动机是实现互动式搜索、进而实现分类导航和查询精确相关的必要条件。本课题研究面向新一代搜索引擎的用户模型特点,通过分析用户行为、目的及动机的关系,提出面向新一代搜索引擎的用户动机推演模型是“自动、智能地收集用户信息、根据这些信息准确推演用户动机、从而为搜索引擎提供辅助支持的模型”,从推演用户的查询动机入手,采用基于数据流的机器学习、数据挖掘和文本挖掘技术,结合自然语言理解、行为科学和认知科学理论,研究并实现用户动机模型的分析和推演机制以及辅助信息的内容和结构。作为研究结果,本课题最终将建立一个具有辅助搜索引擎分析和推演功能的用户动机模型原型,并且在现有搜索引擎环境下,实现一个基于该模型的、具有新一代搜索引擎功能的前端工具。
Internet上支持高质量E-Services的零输入个性化技术的研究,国家自然科学基金项目,60173051,2002.1~2004.12
本课题研究Internet上支持高质量E-Services个性化的关键技术。实现零输入个性化是提高E-Services服务质量而迫切需要解决的难题之一,即在用户正常浏览时,在不增加额外输入的前提下,如何实现面向用户个性化要求的网上信息发现与推荐。我们提出了一种结合数据挖掘、规则解析和信息集成技术的CMR个性化方法。研究内容包括:个性数据采集技术、Web数据(仓)库技术、面向个性化的Web数据挖掘技术、个性化规则解析技术以及个性化服务推荐技术,并在此基础上设计和实现一个个性化支持中间件软件系统SmartWeb。该研究涉及数据处理、人工智能、行为科学等多种学科,对其深入研究具有很高的理论研究价值和广阔的应用前景。