学术论坛

具身交互智能论坛

论坛简介

        当越来越多的智能机器走入人们的生活,协助我们的工作,如何以物理形态与用户进行自然、直观的交互,是具身交互智能所关注的核心问题。随着人工智能和机器人技术的快速发展,和传感器、执行器和计算能力的持续进步,智能系统具备了能够更好地感知环境、理解用户需求,并作出相应的回应的基础。本次论坛邀请知名高校及企业的优秀学者汇聚一堂,观点碰撞,探究如何利用具身智能实现自然、高效的交互技术;如何提升感知能力使智能系统具备更为精准、全面的环境感知和对用户意图的理解能力;如何使智能系统能够在复杂环境和任务需求下协同工作;如何赋予具身智能系统自主决策和交互学习能力。本论坛鼓励作者提交以具身交互智能为主题的优秀学术论文。

论坛日程

论坛时间:2024年5月24日09:00-12:20(10:30-10:50茶歇)

论坛名称:具身交互智能论坛

主持人:马楠、刘永进

论坛主席

刘永进

清华大学长聘教授

个人简介:刘永进,清华大学计算机系长聘教授,人机交互与媒体集成研究所所长,中国图象图形学学会智能图形专委会主任,国家杰出青年基金获得者(2018.01-2022.12),科技部“重大自然灾害监测预警与防范”重点专项(文化遗产保护利用专题任务)总体专家组专家。近五年在PAMI/TOG/SIGGRAPH/TIP/TAFFC/TVCG/CVPR/AAAI/CVPR以及Brain Research等交叉领域内权威期刊会议上发表近百篇,其中SCI论文六十余篇,6篇论文入选ESI高被引及热点论文,获得两次世界华人数学家联盟年度最佳论文奖,六项专利技术作价1100万进行了成果转化。两次获得中国人工智能学会吴文俊人工智能自然科学奖,两次获得北京市科学技术奖,获2022年中国图象图形学学会高等教育教学成果奖一等奖,以及2011年国家技术发明二等奖。


马楠

北京工业大学教授

个人简介:马楠,北京工业大学教授,博士生导师,担任国家重点研发项目负责人,智能感知与自主控制教育部工程研究中心副主任,中国人工智能学会副秘书长,CCF杰出会员,北京图象图形学学会常务理事,国家级一流本科课程负责人,北京市智能制造与机器人创新专项负责人,研究方向为交互认知、机器视觉、无人驾驶与移动机器人。以第一完成人先后获得中国图象图形学学会科技进步一等奖、中国电子学会科学技术奖【技术发明类】二等奖,主持多项国家、省部级项目,承担北汽集团、东风悦享、云迹科技等企业委托智能交互项目10项。带领团队多次在国际、国内人工智能、无人驾驶重要比赛中获得冠军,团队成果“无人驾驶云智能交互系统”获得第二届中国“AI+”创新创业大赛总决赛特等奖(2000余参赛队),获得第六届全国教育科学研究优秀成果奖二等奖和北京市教学成果一等奖。


论坛讲者信息

张立华

复旦大学特聘教授

报告题目:物理仿真与虚实交互

报告摘要:物理仿真是指通过数值计算方法,在虚拟环境中模拟自然界中的物体运动规律,以实现物理现象的真实动态模拟,被广泛应用于电影制作、游戏开发、虚拟现实、机器人仿真等各领域。本报告聚焦讨论物理仿真技术对虚实交互的重要意义和影响:首先系统回顾物理仿真技术的发展历程以及物理引擎的基本原理,然后重点描述物理仿真技术在医学模拟、自动驾驶、脑机交互等虚实交互场景中的应用,最后对物理仿真和虚实交互的未来发展趋势进行展望。

个人简介:张立华,国家重大人才工程A类专家、CAAI Fellow,现任复旦大学特聘教授、智能机器人研究院常务副院长、元宇宙智慧医疗研究所所长,智能机器人教育部工程研究中心副主任, CAAI人机融合智能专委会主任委员、脑与AI决策咨询专家团队核心专家。研究方向包括机器直觉、人机融合智能等新一代人工智能理论、计算机视觉与行为识别、物理仿真与数字孪生、脑机交互与智慧医疗等。曾获中国人工智能学会优秀科技工作者与优秀科技成果奖、上海市优秀学术/技术带头人、吉林省拔尖创新人才(第一层次)等奖励。牵头承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重大项目、上海市人工智能科技重大专项等多个国家及省部级重大重点科研项目。


徐凯

国防科技大学教授

报告题目:三维几何引导的具身感知与交互

报告摘要:视觉感知是机器人探索、感知和理解未知环境的最重要方式。随着三维传感和重建技术的飞速发展,三维图形正与机器人视觉深度融合,形成三维几何引导的具身感知与交互新途径,支持机器人对未知环境和对象的探索式感知和自适应交互,并最终支持机器人在三维环境中实现具身智能。本次报告围绕三维环境的重建、理解、交互,汇报我们近年来的系列工作,包括:鲁棒可扩展的实时三维重建,机器人自主/协同式场景扫描重建,机器人主动式场景语义导航,以及三维几何引导的机器人灵巧抓取等。最后尝试探讨基于三维感知与交互的世界模型构建与演进,以及“模型可知”假设条件下的具身智能未来发展。

个人简介:徐凯,国防科技大学教授。国家自然科学基金杰出青年基金获得者。普林斯顿大学访问学者。研究方向为计算机图形学、三维视觉、具身智能、数字孪生等。发表CCF A类论文80余篇,其中包括计算机图形学顶级会议SIGGRAPH论文29篇。担任ACM Transactions on Graphics等顶级国际期刊的编委。担任中国三维视觉大会China3DV 2024的大会共同主席,以及中国图形学大会Chinagraph 2024的程序委员会主席,多次担任领域重要国际会议的论文主席。担任中国图象图形学学会三维视觉专委会副主任、中国工业与应用数学学会几何设计与计算专委会副主任。获湖南省自然科学一等奖2项(排名1和3)、中国计算机学会自然科学一等奖(排名3)、军队科技进步二等奖、军队教学成果二等奖等。


张天雷

主线科技正高级工程师

报告题目:具身人工智能在物流运输领域的应用

报告摘要:随着科技的飞速发展,人工智能(AI)已经逐渐渗透到各行各业,为诸多领域带来了革命性的变革。物流运输作为现代经济体系的重要组成部分,其效率与智能化水平对整个社会的运转速度具有决定性影响。尽管具身AI在物流运输领域的应用前景广阔,但仍面临诸多挑战,如技术成熟度、法规政策、数据安全与隐私保护等。为了推动具身AI在物流运输领域的广泛应用,需要政府、企业和研究机构共同努力,加强技术研发、完善政策法规、保障数据安全。展望未来,随着技术的不断进步和市场的日益成熟,具身AI将在物流运输领域发挥更加重要的作用。从自动驾驶车辆的普及到智能仓储管理的优化,再到自动化分拣系统和智能配送的完善,具身AI将持续推动物流运输行业的创新发展,为社会带来更加便捷、高效、智能的物流服务。

个人简介:张天雷,清华大学计算机科学与技术系博士,师从李德毅院士,中共中央组织部“万人计划”科技创新领军人才,入选中国科学技术协会第三届青年人才托举工程,是自动驾驶决策规划控制与仿真专家,正高级工程师。现任主线科技CEO、中国人工智能学会智能驾驶专业委员会秘书长。曾获得2020中国指挥与控制学会科学技术进步奖一等奖、2020中国电子学会技术发明奖二等奖、第二十一届中国专利优秀奖、第二十届中国专利银奖。已公开有60余项无人驾驶相关专利,作为项目负责人承担了国家重点研发计划综合交通运输与智能交通重点专项下自动驾驶相关课题,负责了天津港、宁波舟山港、上海临港新片区等多个重点项目,率领团队打造了全球最大规模的港口无人驾驶物流车车队和中国首个干线物流自动驾驶商业项目,为自动驾驶技术在我国实现科技成果转化落地作出了突出贡献。


高跃

清华大学副教授

报告题目:超图计算

报告摘要:许多生物、社会和技术系统的复杂性源于系统单元之间丰富性的相互作用。社会交流、化学反应、生命系统到生态系统中相互作用通常发生在三个或更多对象的组中,并不能简单地用二元关系来描述。有效地利用这些高阶关联结构能够增强对各类系统的建模能力,帮助理解和预测其动态行为。超图是建模此类高阶交互、即高阶关联的天然结构。实际应用中通常也面临数据不足和关联复杂难题。本报告主要介绍面向高阶关联的超图计算理论、方法及应用。具体而言,从由数据到高阶关联的映射、由高阶关联到语义表示的映射及高阶关联语义领域泛化三个维度介绍高阶关联的超图结构建模、数据和高阶关联协同的超图语义计算及面向不同领域的超图计算应用相关进展。

个人简介:高跃,清华大学长聘副教授、博士生导师。国家青年特聘专家、DeepTech 2022年中国智能计算科技创新人物,主要研究领域为人工智能、计算机视觉及医学图像处理,特别是超图计算基础理论、方法及应用,在IEEE TPAMI等国际期刊及会议发表论文百余篇,论文引用万余次,出版《Hypergraph Computation》等英文专著,多次入选Clarivate高被引科学家和爱思唯尔中国高被引学者,担任计算机视觉领域International Journal of Computer Vision和医学图像处理领域Medical Image Analysis等期刊编委,曾获得中国电子学会自然科学一等奖、福建省科技进步一等奖等。


高林

中国科学院计算技术研究所研究员

报告题目:高斯泼溅与神经辐射场的研究进展

报告摘要:在本次报告中,我们将分享高斯泼溅和神经辐射场等新型的几何表征,并探讨这几种几何表征各自的优劣,并将探讨基于几何优化的高斯泼溅渲染质量优化,基于神经辐射场的复杂材质重建,基于高斯泼溅的材质编辑和大尺度变形方法以及基于高斯泼溅与神经辐射场的几何模型生成方法。

个人简介:高林,中科院计算所研究员,博士生导师,国科大岗位教授,研究方向为计算机图形学,三维计算机视觉。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文80余篇,研发的人脸AIGC的APP被全球180余个国家或者地区的用户所使用。现任或者曾任SGP 2023 大会联合主席,China3DV2023程序委员会联合主席,SIGGRAPH 2023程序委员会委员,IEEE TVCG编委,CSIG智能图形专委副秘书长,入选国家自然科学基金委优青,北京市杰青,英国皇家学会牛顿高级学者,曾获得亚洲图形学会青年学者奖,吴文俊人工智能优秀青年奖,CCF技术发明一等奖,CCF CAD&CG 开源软件奖等奖励。


论坛联系人

姓名:韩义恒

单位:北京工业大学

邮箱:hanyiheng@bjut.edu.cn

脑影像学前沿论坛

论坛简介

        脑影像学是一门研究人脑结构和功能的学科,利用各种影像技术来观察和分析人类大脑。脑影像学的发展可以追溯到上世纪的X射线技术,随后出现了更先进的技术,如计算机断层扫描(CT)和磁共振成像(MRI)。这些技术能够非侵入式地提供高分辨率的人脑影像,从而使研究人员和医生能够更好地了解脑部结构的异常和功能活动的特征。

        脑影像学在神经科学研究中具有重要意义。通过脑影像技术,研究人员可以观察脑部的各个结构,了解它们的相互关系和功能,从而揭示大脑的工作原理。在临床医学中,通过脑影像技术,医生可以检测和诊断脑部疾病和损伤,例如中风、肿瘤、神经退行性疾病等。脑影像可以提供关于脑部结构异常、血液供应异常和组织损伤等方面的信息,从而帮助医生做出合理的治疗决策。

         论坛围绕脑影像学的前沿科技进展,旨在推动神经科学的发展和临床医疗水平的提升。

论坛主席

 

胡德文

CSIG常务理事、国防科技大学教授

个人简介:胡德文,国防科技大学智能科学学院教授,博士生导师,主要从事控制科学与工程、脑科学与认知科学等方面的研究,在神经计算及智能机器人控制等领域取得了系统性和创造性成果。是国家杰出青年科学基金获得者、教育部长江学者特聘教授、全国优秀科技工作者、国家“万人计划”领军人才,军队专业技术二级专家。出版学术著作10部,在Science Advances,Brain,PNAS及IEEE Transactions等发表SCI检索论文250余篇。成果“神经生物信息模式识别与时空分析”“功能成像的脑连接机理研究”分别获得2012年度和2018年度国家自然科学奖二等奖,2020年获全国创新争先奖状。


论坛讲者信息

刘勇

北京邮电大学教授

报告题目:IBRAIN: 阿尔茨海默病早期影像学标记研究及系统

报告摘要:多模态磁共振脑成像能够无创地提供人脑结构与功能活动信息,脑结构改变是临床阿尔茨海默病(AD)早期鉴别诊断的重要特征之一。如何从磁共振图像中精准刻画AD脑结构高维复杂异构的表征,进而解析AD异表征的临床生物学机制是建立早期AD生物学标记的重要前提。团队最新研究融合多尺度脑结构信息、基因组和生化指标,基于全球跨疾病数据集(中、美、英、澳、欧等8种退行性疾病13000例数据),建立了AD 个体化影像学标记(IBRAIN),融合基因风险、生化数据等阐明了IBRAIN的生物学机制,纵向追踪定量刻画MCI个体化转化风险及机制。我们希望借此与大家探究基于脑影像进行个体化定量预测的可行性。

个人简介:刘勇,博士,教授,北京邮电大学人工智能学院。主要研究方向:脑影像智能理解。研究工作以探究多中心、多模态脑影像计算方法及阿尔茨海默病(AD)的影像异常表征为核心。以通讯(含共同)作者发表论文40余篇, 包括eClinicalmedicine, Science Bulletin, Advanced Science, Biological Psychiatry, Brain等;论文他引10000余次。授权专利7项。作为负责人承担包括科技部科技创新2030-重大项目课题、国家重点研发计划课题、国家自然科学基金重点项目、中国科学院重大基础研究项目(先导B, 2017-2020)等。入选北京市自然基金杰出青年基金(2020)等,获吴文俊人工智能科学奖自然科学一等奖(2019,排名第2)等学术奖励。入选Elsevier中国高被引学者(2020, 2021, 2022, 2023)。


 

张道强

南京航空航天大学教授

报告题目:脑网络智能分析技术前沿进展与应用

报告摘要:脑网络是表征大脑不同区域之间结构和功能连接的图模型,对其复杂拓扑信息的分析挖掘有助于理解大脑不同区域的协作机制,在脑疾病诊断等领域具有重要的作用。本报告主要介绍基于脑网络智能分析的前沿进展与应用,包括脑网络构建及分类算法、动态脑网络、多模态脑网络、多中心脑网络等,以及在阿尔茨海默病等脑疾病早期诊断中的应用。

个人简介:张道强,教授,博士生导师,脑机智能技术教育部重点实验室主任。入选“万人计划”科技创新领军人才和青年拔尖人才、国家优秀青年科学基金获得者、国际模式识别学会会士(IAPR Fellow)、亚太人工智能学会会士(AAIA Fellow)等。目前主要从事人工智能、机器学习、模式识别、医学图像分析等领域的研究工作。主持国家自然科学基金重点/优青、国家重点研发计划课题等多个项目。在相关领域发表学术论文200 余篇。部分第一/通讯论文发表在领域内重要国际期刊,如Nature Communications、IEEE TPAMI、IEEE TMI、IEEE TIP、Neuroimage、Human Brain Mapping、Medical Image Analysis等,以及重要国际会议,如NeurIPS、MICCAI、IJCAI、AAAI、CVPR、KDD等。据Google Scholar 统计,论文已被国际同行引用19000 余次。担任中国图象图形学会监事、阿尔茨海默病防治协会理事、中国图学学会图学大数据专委会副主任、中国人工智能学会机器学习专委会常委、中国生物医学工程学会医学信息与控制分会常委、江苏省人工智能学会医学图像处理专委会主任等。任IEEE Trans. Medical Imaging、Pattern Recognition、Machine Intelligence Research、《自动化学报》等期刊编委,以及《数据采集与处理》期刊副主编。获国家自然科学二等奖1项、教育部自然科学一等奖和二等奖各1项,指导博士生/博士后2次获医学影像领域重要国际会议MICCAI青年科学家奖。2014-2023 连续10年入选Elsevier 中国高被引学者榜。


 

段旭君

电子科技大学教授

报告题目:孤独症脑影像联盟:绘制中国孤独症儿童脑发育图表

报告摘要:孤独症谱系障碍是由多种不同原因引起的神经发育障碍,其核心症状包括社交沟通障碍、行为刻板及兴趣狭窄等。孤独症的发生与大脑发育异常密切相关。然而,由于孤独症高度的临床表型及影像学特征异质性,单中心、小样本脑影像数据往往缺乏可靠性,限制了神经影像研究在临床实践中的推广应用。2014年,美国纽约大学儿童研究中心通过联合多家单位构建了目前国际上最大的孤独症脑影像共享数据库The Autism Brain Imaging Data Exchange(ABIDE),来帮助各国研究者探究孤独症潜在的神经机制,寻找适合临床诊断的神经影像标记物,取得了巨大的进展。然而ABIDE数据库的受试者主要为欧美地区的高加索人,人种、文化及地区的巨大差异都使得基于ABIDE的大样本孤独症脑影像研究在中国及亚洲地区的临床使用与推广存在巨大的局限性。因此,我们联合国内多家孤独症脑影像研究机构,建立孤独症脑影像联盟,整合孤独症多中心脑影像大数据,进行资源共享,旨在构建中国孤独症儿童脑发育图表,探究中国孤独症儿童发展规律,寻找潜在的脑影像标记物。本报告将主要介绍利用孤独症脑影像联盟大数据绘制中国孤独症儿童脑发育图表所取得的初步发现。

个人简介:电子科技大学生命科学与技术学院教授,博士生导师,电子科技大学“百人计划”入选者,国家自然科学基金优秀青年基金获得者,2023年国际脑图谱年会(OHBM)Keynote Speaker;入选2023年中国区神经科学领域最佳科学家排名(Research.com)。主要研究领域为孤独症脑影像,在孤独症脑动态网络成像、多模态融合成像、脑成像引导的神经调控等方面开展了一系列研究,建立了“评估-干预-成像”的孤独症智能诊疗平台,并开展临床应用。发起并牵头成立“孤独症脑影像联盟”,构建国内多中心、大样本孤独症儿童脑影像数据库。相关研究成果以第一/通讯作者发表在PNAS,Biological Psychiatry等期刊;主持5项国家自然科学基金项目(均为孤独症脑影像领域)。


李宝娟

空军医学大学研究员

报告题目:基于脑连接分析的抑郁症个体化诊疗

报告摘要:大量神经影像学研究显示,抑郁症涉及独特的脑环路连接受损。课题组深入研究了抑郁症患者的脑连接受损模式,发现抑郁症患者的全脑连接受损模式主要包括三种不同的类型。这些模式在Meta MDD数据库的多个中心间高度一致。在此基础上,课题组探索了基于不同患者脑连接模式及不同症状的个体化精准rTMS干预方案,并对其快速抗抑郁及缓解自杀的神经环路基础进行了深入探索。

个人简介:空军军医大学研究员。英国伦敦大学学院联合培养博士,哈佛大学博士后。空军军医大学“凌云”工程“雏鹰”计划获得者。主要从事基于神经影像的脑网络分析方法学研究。在国际上首次提出了可用于静息状态fMRI数据分析的随机动态因果模型。近年来共发表科研论文60余篇,最高SCI影响因子13.382,论文被Science等杂志引用及评论2000余次,主编及参与编写学术专著4部,其中,主编英文专著1部,以第一作者出版英文专著章节1章,副主编教材1部。主持哈佛大学附属麻省总院Martinos中心博士后基金项目、国家自然科学基金项目等7项,参与国科金重点项目、军队重点项目等10余项。担任Wires Cognitive Science杂志Section editor。Frontiers in Neuroscience杂志Guest Associate Editor、Frontiers in Human Neuroscience杂志Guest Associate Editor、中国图象图形学学会医学影像专业委员会委员、医学科学技术委员会卫生装备学专业委员会卫生装备培训分委员会委员。IEEE Transactions on Medical Imaging、Human Brain Mapping、Frontiers in Human Neuroscience等多个期刊审稿人。


论坛联系人

姓名:刘亚东

单位:国防科技大学教授

邮箱:liuyadong1977@163.com

先进成像技术论坛

论坛简介

        随着算力的提升和新成像体制的涌现,推动了新型成像系统研究,这些先进成像技术大部分用于解决传统光学无法或者难以解决的问题,应用在多种特殊领域。诸如干涉成像、微纳光学、逆光成像、非视域成像、极简光学、事件相机成像等,在算力和算法的加持下不断突破传统光学设计约束,在多个恶劣场景下成像效果提升明显,在SWaP方面表现优异,是未来成像技术的发展方向。先进成像技术在航空航天领域、工业生产领域、民用产品领域均有大量的应用和需求。相关技术的研究,对学科的发展、工业技术的进步以及国家战略的加强,都有着重要意义。

论坛日程

论坛时间:2024年5月24日09:00-12:20(10:30-10:50茶歇)

论坛名称:先进成像技术论坛

主持人:李宇海、雷浩

 

论坛主席

汶德胜

CSIG理事,中国科学院西安光学精密机械研究所研究员

个人简介:汶德胜,中科院西安光学精密机械研究所研究员,中国图象图形学学会理事、视觉传感专业委员会主任委员,中国光学学会会员、空间光学专业委员会副主任委员,空间科学与应用标准委员会委员,美国光学工程学会SPIE会员。主要从事空间光学载荷、光电成像、快速信号处理等领域技术研究工作。曾获国家科技进步特等奖一次、科技进步二等奖一次,国防科技进步一等奖一项、中科院科技进步二等奖一项及突出贡献奖2次、军队科技进步二等奖二项,发表学术论文100余篇。2000年获政府特殊津贴奖励、获陕西省优秀留学回国人员,2007年入选陕西省“三五人才工程”,2008年获探月工程“嫦娥一号”任务突出贡献奖,2020年获中国航天基金航天贡献奖。


李宇海

电磁空间安全全国重点实验室研究员

个人简介:李宇海,博士,研究员,现就职中国电科光电研究院,任电磁空间安全全国重点实验室天津分部副主任。中国兵工学会会员、光学工程学会计算成像专委会青年委员、《应用光学》青年编委。长期从事光电系统技术、光电信号处理等研究,承担某科委、科工局等重点项目10余项,电科联合基金、“叶企孙”科学基金2项,授权专利11项,发表论文16篇,荣获省部级奖项2项、电科集团奖项2项、厅局级奖项4项,荣获2022年度天津市国防工业系统五四青年奖章。


论坛讲者信息

时尧成

浙江大学教授

报告题目:硅基片上光学相控阵扫描芯片

报告摘要:随着对激光雷达的需求不断增长,光学相控阵(OPA)被认为是领先的技术之一,它可以在没有机械扫描的情况下提供全固态光束转向。光学相控阵基于改变波导阵列单元中的光学相位的原理来实现光束控制,从而调制发射光束的波前。我们将介绍基于硅波导平台的高速、低功耗、宽波束转向角光学相控阵。为了克服光栅波瓣的限制,采用了宽度非均匀的波导阵列作为发射极,在远场中将不会出现高阶光栅波瓣,实现了具有宽视场、不受光栅波瓣角度限制的OPA。此外,还将介绍用于实现二维广角光束转向的新型结构。

个人简介:时尧成,浙江大学教授,博士生导师,国家优秀青年科学基金获得者,浙江省万人计划科技创新领军人才。现任浙江大学光电学院副院长、国家光学仪器工程技术研究中心副主任,主要从事硅基光子集成芯片及其应用研究,近年来在本领域知名国际期刊共发表SCI收录论文170余篇,被引用7000余次,h-index48。受邀担任OECC本领域重要国际会议的程序委员会共主席等10余次,受邀在Photonics West等本领域重要国际会议作特邀报告30余次。作为项目负责人承担国家自然科学基金重点项目、国家重点研发计划课题等国家级项目10余项,获浙江省自然科学一等奖、中国光学学会光学科技一等奖等奖项。


林杰

哈尔滨工业大学教授

报告题目:超表面器件与光学感知

报告摘要:超表面是一种新兴的微纳光学器件,利用微结构单元调制电磁波的相位、振幅、波长和偏振等维度,具有丰富的电磁波调制自由度和优异的调制能力,因而在成像、光谱、传感等领域具有重要的应用。团队针对可见光、红外光等波段,开展了TiO2和硅的超表面器件制备,实现了大视场偏振成像、红外探测等功能。本报告将介绍团队在超表面器件设计理论、制备工艺和成像应用的相关工作。

个人简介:林杰,博士,教授,博士、研究生导师,主要从事微纳器件、超表面、光学感知与成像、精密测量等研究。主持和参研国家自然科学基金联合基金“叶企孙”基金项目(重点支持)、面上项目、国家重点研发计划课题、国家部委项目、863计划、国家科技重大专项、国家重大科学仪器设备开发专项等20项。在Engineering(中国工程院院刊)、Nano Letters、等学术刊物发表SCI、EI论文80篇,申请国际国内发明专利50项,授权30项,出版专著1本。2022年入选黑龙江省高层次人才,获2014年黑龙江省科学技术奖二等奖(序2),2012年中国仪器仪表学会奖学金-金国藩青年学子奖学金。担任全国光电测量标准化技术委员会委员、《应用光学》青年编委。


刘飞

西安电子科技大学教授

报告题目:散射光场复原中的关键技术研究

报告摘要:在散射光场中,随着光波传输距离的增加,粒子的散射作用导致光波信息逐渐趋于无序化,引起目标成像和信息传递过程中的畸变、缺失和干扰。为了复原散射光场中的目标信息,偏振信息的解译和复用扮演着越来越重要的作用。散射光场中的偏振信息有效记录了光场的强度分布特征,而且能够表征光场中光矢量的振动情况,从而可以为散射光场的信息复原拓展新的物理维度。在此背景下,通过解译光波在散射光场中的光矢量传输特性,对光场强度、电矢量振动方向,以及角动量信息进行深入研究,以有力提升散射光场的信息复原效果,从而促进如“穿云透雾”、“绕墙成像”等低信噪比环境的信息解译和复原。

个人简介:刘飞,教授,博士生导师,陕西省杰青,国家级高层次青年人才,西安电子科技大学计算成像研究所所长,西安电子科技大学华山菁英人才计划入选者。现任西安电子科技大学先进光学成像交叉前沿研究中心副主任,西安市计算成像重点实验室副主任,陕西省先进光电成像专委会常务副主任,中国科学院长春光机所应用光学国家重点实验室客座研究人员,光电信息控制与安全技术GF重点实验室客座教授,Journal of Nanophotonics期刊副主编,Cells期刊Computational imaging for Biophotonics and Biomedicine主题Guest Editor,OPTICA Travel Lecture(全球巡讲讲师);中国感光学会青年理事,《激光与光电子学进展》、《光子学报》等多个期刊青年编委。一直从事计算成像技术的研究,在Optics Letters, Optics Express,等国际知名期刊发表学术论文40余篇,累计引用超过1500余次。


李磊

四川大学研究员

报告题目:液体透镜与计算变焦成像技术及应用

报告摘要:近十几年来轻量化光学成像系统发展迅猛,传统的机械移动式变焦技术成为了限制成像系统轻量的重要瓶颈。而近年来兴起的液体透镜和计算变焦是实现轻量化变焦的重要途径。液体透镜是以液体为光学介质的曲率可变的新型光学透镜,在成像、显示、通讯、照明等领域有着重要的应用。液体透镜可以通过曲率半径的变化代替机械移动实现光学变焦。本报告将介绍液体透镜结构、原理及在变焦成像系统中的应用。着重介绍的基于液体透镜的光学变焦成像系统。同时,将介绍计算变焦成像系统,着重介绍一款我们提出的一种基于深度学习的全景并行相机。此外,报告还将对液体透镜变焦技术和计算变焦技术进行对比分析,并对两者结合的可行性进行展望。

个人简介:李磊,四川大学 研究员博士生导师,从事液体透镜、成像和显示技术。主持了5项国家级科研项目,并主持华为、思谋等横向合作项目。在本学科领域的国际权威期刊Advanced FunctionalMaterials、Opto-Electronic Advances、PhotoniX、Optics Letters、Optics Express、Optics and Lasers in Engineering等期刊上发表第一/通讯作者论文46篇,授权第一发明人专利9项,作为主编之一编撰了学术专著1部,参研的项目获得了2012年军队科技进步二等奖,2023年优秀西部科技成果奖。在国际国内学术会议做邀请报告20余次,并担任国际学术会议的分会主席3次。


朴明旭

长春理工大学副教授

报告题目:极简化单一光学元件成像技术

报告摘要:光学系统的小型化、轻量化和集成化是现代成像系统的发展趋势。本报告分析了成像衍射光学元件的成像特性,将成像衍射光学技术与计算成像技术相结合,消除传统单层衍射光学元件的宽波段或多波段低衍射效率对成像质量的影响,拓展了单层衍射光学元件的应用波段范围。同时,设计了单平面计算衍射光学元件,分析了单平面衍射光学系统的像差特性,采用计算模型消除了轴外像差对成像的影响。本报告分析了折叠光路成像系统的设计方法和杂散光分析方法,提出单一光学元件成像的宽波段、多波段折叠光路系统。为了消除环境温度对折叠光路成像系统的影响,采用光-数联合优化设计方法,推导了遮拦比与相位掩膜板参数的关系,以实现宽温度范围离焦一致性。

个人简介:朴明旭,男,长春理工大学光电工程学院副教授,博士生导师,吉林省高层次D类人才,主要从事先进光学系统设计、成像衍射光学技术和计算成像方面的研究。主持国家自然科学基金、慧眼行动、吉林省科技厅等共计15项,围绕衍射光学和先进光学设计理论,以第一/通讯作者在Optics Express、Optics and Lasers in Engineering等学术期刊发表论文20篇,授权或申请国家发明专利10项。作为第一起草人制定了推荐性国家标准《成像衍射光学元件衍射效率的测量方法》,在国际上首次建立起成像衍射光学元件衍射效率的规范化、标准化测量方法,为成像衍射光学元件的质量评价提供客观依据。获得2022年度金国藩青年学子奖、吉林省自然科学学术成果奖、吉林省优秀博士学位论文。


论坛联系人

姓名:雷浩

单位:西安交通大学

邮箱:leihao.ai@xjtu.edu.cn

生物医学计算成像与人工智能

论坛简介

        生物医学成像领域正面临着前所未有的机遇和挑战,计算成像技术和人工智能的发展也为生物医学研究和临床实践带来了巨大的变革。计算成像和人工智能技术的结合为生物医学数据和图像的获取提供新思路和新手段,为疾病的早期诊断、治疗方案的制定以及对生物过程的理解提供了重要的工具。

        为促进跨学科的交流和合作,我们邀请了领域内领先的专家发表主题演讲,涵盖计算成像技术的前沿进展、人工智能在医学图像分析中的应用、基于深度学习的模型设计与优化等内容。我们期望能够推动生物医学计算成像技术和人工智能的创新与发展,加快科学研究成果的转化和应用,为生物医学领域的进步和人类健康的提升做出贡献。

论坛日程

论坛时间:2024年5月24日 09:00-12:20

论坛名称:生物医学计算成像与人工智能

主持人:刘华锋

论坛主席

刘华锋

CSIG理事、浙江大学教授

个人简介:刘华锋 , 浙江大学光电学院教授,博士生导师。国家杰青获得者,获国际学术奖项5次,两次获浙江省自然科学技术二等奖(排名1)。主持了多项科技部、国家自然科学基金面上、重点和重大仪器研制项目和浙江省项目。发表高质量论文200多篇;获得授权发明专利70多项。

牟轩沁

CSIG常务理事、西安交通大学教授

个人简介:牟轩沁 ,西安交通大学信息与通信工程学院教授,数据智能计算与通信创新研究所所长,图像处理与识别研究所所长,国家数据广播工程技术研究中心主任。担任国家自然科学基金委员会第十二届学科专家评议组成员,中国图象图形学学会常务理事,陕西省图象图形学学会理事长,中国体视学学会副理事长。主持过10余项国家各类基金项目的研究工作,发表论文200余篇,Google Scholar引用14000余次。获得过1999年教育部发明类科技进步二等奖(第一获奖人),2017年组织了CT/PET/SPECT领域内首要国际会议(两年一次系列会议),并担任大会主席。


论坛讲者信息

马建华

南方医科大学教授

报告题目:现代医学CT成像中的挑战与机遇

报告摘要:医学CT是支撑影像医学的大型医疗装备,具备全身全脏器成像功能。随着人工智能、光子计数X线探测器、冷阴极X线球管等软硬件技术的发展,现代医学CT大大丰富了其临床应用,包括低剂量成像、灌注成像、能谱成像、静态成像等。然而,上述成像在临床应用中仍面临诸多挑战,需要针对性的解决方案预以克服。本报告首先重点介绍现代医学CT成像中的几个主流技术,包括低剂量成像技术、脑灌注成像技术、能谱成像技术,及其面临的挑战和机遇,随后介绍医学CT成像的未来技术发展趋势和个人思考。

个人简介:马建华,主要从事高端医学X射线CT成像方法与技术研究,紧密围绕“如何实现低剂量X射线CT精准成像”这一医学与信息科学学科交叉领域的重要科学问题,在CT数据建模与图像重建、灌注CT功能成像与能谱CT定量成像、高端CT低剂量成像软件系统研制等方面取得了系统性创新成果。近5年来,主持国家级课题6项、省级课题2项、市级课题1项;在医学成像领域TOP 1期刊IEEE Transactions on Medical Imaging发表长文13篇;授权国家发明专利17件、转化12件;分别获2019年广东省技术发明奖一等奖(第一完成人)及2015年广东省科学技术二等奖(第二完成人)。兼职任广东省医用放射成像系统工程技术研究中心主任、广州市医用放射成像与检测技术重点实验室主任及为4个国家级学会的理事/副主任委员。


朱守平

西安电子科技大学教授

报告题目:乳腺平板PET成像及其临床应用验证

报告摘要:精确诊断对提升乳腺癌患者的五年生存率十分必要,正电子发射断层扫描(Positron Emission Tomography,PET)成像在肿瘤的精确诊断、疗效评估等方面具有重要的应用价值。平板PET系统以其结构灵活可变,灵敏度高,易与其他成像或治疗设备融合的特点得到了广泛的关注。本报告将介绍一套乳腺专用的平板PET成像系统及其初步的临床实验效果。该系统采用数字化的基本探测单元(BDM)构成,为了提升系统性能,报告人在平板PET探测数据符合预处理、系统响应矩阵建模、GPU重建加速、重建伪影抑制、系统性能评估等方面开展了系列工作,该系统目前已经进行了多例的临床试验,验证了其在临床应用层面的性能。

个人简介:朱守平,西安电子科技大学华山学者特聘教授,博士生导师,入选学校首批“工程型精英人才”,中国图学学会第八届理事会医学图像与设备专业委员会常务委员,陕西省生物医学工程学会常务理事。近年来的研究工作主要围绕多模态影像系统开发和成像方法研究展开,以主持人身份获得国家重点研发计划项目、国家自然科学基金面上项目等多个项目资助,同时参与2项国家重大科研仪器专项研制工作。在IEEE Trans Med Imaging等业界主流期刊发表论文多篇,授权发明专利21项(第一发明人),获教育部高等学校科学研究优秀成果奖科技进步二等奖1项(第3完成人),获陕西高等学校科学技术二等奖(第2完成人)1项,陕西省自然科学二等奖1项(第3完成人)。


姚保利

中国科学院西安光学精密机械研究所研究员

报告题目:深度学习在光学显微成像中的应用

报告摘要:随着数字人工智能时代的到来,传统光学显微成像技术也逐渐进入到计算显微成像时代。它摆脱以光学成像系统直接捕捉目标图像的成像方式,取而代之的是利用波动光学、几何光学等理论以计算重构的方式获得常规显微手段难以得到的样品高维物理信息。其中,深度学习神经网络技术在解决显微成像中的三维大数据压缩采集、高质量光学衍射相位恢复、超分辨图像重构、高速成像等问题上显示出一些独特的优势和发展潜力。以数据驱动为基础的深度学习神经网络技术逐步向以物理模型驱动的技术发展。报告介绍本团队在该方向的一些研究进展。

个人简介:姚保利,中国科学院西安光机所瞬态光学与光子技术国家重点实验室主任,二级研究员,博士生导师,国务院政府特殊津贴专家。主要从事超分辨显微成像、三维显微成像、定量相位成像、透过散射介质成像、光学微操纵、光场调控等方面的研究工作。研制出国内首台具有自主知识产权的结构照明超分辨显微成像系统,分辨率达到90nm同类技术国际领先水平;研发的激光光镊产品成功投放于市场并出口加拿大;研制出国际首台双光子激发激光扫描实时立体显微镜。在国内外学术期刊上发表论文330余篇,出版专著章节7部,授权发明专利26项。获陕西省科学技术一等奖2项,二等奖2项。获科学中国人2017年度人物、中国科学院王宽诚西部学者突出贡献奖、日本“高速成像奖”。


庄吓海

复旦大学教授

报告题目:医学影像显式建模与可解释人工智能分析

报告摘要:医学影像人工智能在计算机辅助诊断和治疗等现代医学中发挥着重要的作用。然而,当前模型的弱可解释和泛化问题却是其应用和推广所面临的两大挑战:深度学习方法大多以黑盒方式构建,神经网络模型的可解释性较差;其次在涉及多模态、跨中心图像、弱无监督学习场景时其泛化能力往往受到限制。本次讲座将介绍我们近期从解决图像异质性的角度出发,提出显式建模图像特征和分布,根据属性变量依赖关系构建神经网络模块,实现主动式可解释深度学习方法。前期实验结果表明,基于显式建模的可解释神经网络能够显著提高模型的泛化能力。

个人简介:庄吓海,复旦大学大数据学院教授,研究方向是医学影像显式建模方法和可解释人工智能分析等。多项第一或通讯作者工作被国际组织或顶会提名奖项(如IPMI Francois Erbsmann Prize,MICCAI Best Paper/Young Scientist Award),其中2023年的可解释医学影像分析工作获得爱思唯尔Med Imag Ana和国际MICCAI学会联合颁发最佳论文奖(1/~2000),为至今中国内地唯一第一单位获奖;近五年以第一/通讯发表IF>10期刊文章23篇(其中6篇TPAMI)。自2020年以来连续入选爱思唯尔-斯坦福大学发布全球顶尖科学家 “终身”和“年度”科学影响力榜单;目前担任国际MICCAI学会常务理事;担任IEEE TMI、Med Imag Anal、Neurual Networks等多中科院一区期刊的编委。


牟轩沁

CSIG常务理事、西安交通大学教授

报告题目:Radon变换的微分几何分析与稀疏扫描CT重建

报告摘要:传统的CT理论要求Radon变换投影应具有完备性,稀疏扫描等不完备投影重建则需要引入图像先验信息以改善重建质量。我们对Radon变换进行微分几何分析,首次推导了反映Radon变换局部特性的通用偏微分方程组,表达了Radon变换中存在的冗余性,因此稀疏扫描数据在一定条件下可以包含完备投影数据的全部信息;在上述理论分析的基础上,我们给出了一种无需图像先验的稀疏扫描CT重建方法,讨论了几种不同CT几何结构下的稀疏扫描和重建问题;报告最后讨论了静态CT设计中存在的问题,以及如何应用所提出的理论来解决静态CT的结构设计和重建算法等问题。

个人简介:牟轩沁,西安交通大学信息与通信工程学院教授,数据智能计算与通信创新研究所所长,图像处理与识别研究所所长,国家数据广播工程技术研究中心主任。担任国家自然科学基金委员会第十二届学科专家评议组成员,中国图象图形学学会常务理事,陕西省图象图形学学会理事长,中国体视学学会副理事长。主持过10余项国家各类基金项目的研究工作,发表论文200余篇,GoogleScholar引用14000余次。获得过1999年教育部发明类科技进步二等奖(第一获奖人),2017年组织了CT/PET/SPECT领域内首要国际会议(两年一次系列会议),并担任大会主席。

论坛联系人

姓名:郭敏

单位:浙江大学

邮箱:guom@zju.edu.cn

 

文化科技中的智能图像图形技术论坛

论坛简介

        文化科技是计算机图形学、计算机视觉、图像处理重要的应用领域,近年来随着智能技术的不断发展,公共文化、文化遗产保护、文旅融合等领域的图像图形学技术飞速发展,极大推动了文化科技的发展。论坛邀请国内在文化科技领域卓有成绩的学者或者承担重要领域任务的专家开展专题报告,旨在进一步推动图像图形学技术在该领域的研究及应用,研讨后续文化科技的持续发展。

论坛日程

论坛时间:2024年5月24日 09:00-12:20

论坛名称:文化科技中的智能图像图形技术

主持人:张加万、耿国华

论坛主席

张加万

天津大学教授

个人简介:张加万,博士,天津大学智能与计算学部教授、博导,贵阳学院副校长,日本JAIST兼职教授、青海省昆仑学者、昆仑英才。张教授是CSIG常务理事,数字文化遗产专委会副主任、可视化与可视分析专委会秘书长、天津市图象图形学学会副理事长,担任天津市文化遗产保护与传承工程技术中心主任,文化部建筑文化遗产保护传承信息技术重点实验室副主任;以首席科学家承担国家重点研究计划项目1项和国家社科基金重大项目1项。以第一作者(或通讯)在ACM Siggraph/TOG、IEEE Vis/TVCG等期刊会议发表学术论文100余篇。


耿国华

西北大学教授

个人简介:耿国华,西北大学二级教授、博导,国家教学名师,国家高层次人才,全国优秀科技工作者,国务院特殊津贴专家,获CCF杰出教育奖,现任文化遗产数字化国家地方联合工程研究中心主任,全国高等院校计算机基础教育研究会副会长,陕西省计算机教育学会理事长,陕西省计算机学会副理事长。长期从事文化遗产数字化、智能信息处理方向研究成果突出。主持获国家教学成果奖4项,带领国家教学团队,主持国家一流课程、教育部全国高校黄大年式教师团队、教育部虚拟教研室建设,教改成果进课堂,辐射带动作用强。主持973预研、国科金重点等项目,带领团队科技文化融合,结合国博、秦陵、秦腔实践,为文化遗产数字化做出了重要贡献,获国家科技奖及省部级科技奖18项。


论坛讲者信息

周明全

北京师范大学教授

报告题目:面向公共文化服务的VR2.0研究

报告摘要:虚拟现实技术外延发展了数字孪生、元宇宙等新的领域。在服务应用方面,面向公共文化教育的巨大需求,研制新型的具有沉浸感,交互技术的VR系统是虚拟现实研究的重要方面,也是人们与虚拟世界交互的重要途径,更是未来教育的大平台。报告结合本人研究工作,探索面向公共文化教育服务的VR装备和无穿戴交互的社会需求。并介绍了完成国家科技支撑计划项目的一些成果。

个人简介:周明全,1997-2004年担任西北大学计算机系主任、软件学院院长,2005-2014年担任北京师范大学信息学院院长;曾任北师大虚拟现实与可视化研究所所长、智慧学习研究院副院长;中国图象图形学学会副理事长、教育部虚拟现实应用工程研究中心主任,北京市文化遗产数字化保护重点实验室主任。现任北京图象图形学学会副理事长,中国虚拟现实产学研战略联盟理事长,新工科信息联盟虚拟现实工作委员会主任。周教授长期从事图形学和虚拟现实应用技术的创新性研究,全国优秀科技工作者,享受国务院政府特殊津贴专家,主持完成国家科技攻关、科技支撑计划、863重点、国科金重点项目10余项,以第一完成人获国家科技进步二等奖、教育部和省科技进步奖13项,第一作者通讯作者发表SCI等收录论文120余篇,学术专著4部,授权发明专利20余项,培养博士41人,硕士百余人。


田丰

中国科学院软件研究所研究员

报告题目:新型自然人机交互技术的一些探索

报告摘要:人机交互是影响人类生活和推动经济发展的颠覆性信息技术。本报告将通过人机交互的发展和现状,重点介绍报告人团队在新型自然人机交互技术中的感知、交互、呈现等方面的一些探索,以及在医疗等领域的应用工作,同时介绍报告人正在承担的国家科技创新2030重大项目“面向神经系统疾病预警的智能人机交互关键技术”的相关工作。

个人简介:田丰,中国科学院软件研究所二级研究员,国家“万人计划”科技创新领军人才,享受国务院政府特殊津贴专家,国家科技创新2030重大项目首席科学家,首批国家重点研发计划项目首席科学家。担任中国计算机学会人机交互专委会主任。作为第一完成人领衔获得了2018年度国家科技进步二等奖、2015年度北京市科学技术一等奖。


 

吕科

中国科学院大学教授

报告题目:高保真数字人建模与驱动关键技术与应用

报告摘要:随着人工智能技术的不断发展,虚拟现实、增强现实、数字孪生和元宇宙正在逐渐从概念走向现实,数字人是其中不可或缺的角色,是近年来产业聚焦的热点和研究的前沿。数字人是存在于非物理世界中多种计算机手段合成的具有多重人类特征的综合体,数字人在泛娱乐、金融、文旅、教育以及医疗等领域都有应用,本报告主要介绍数字人建模与驱动中的关键技术,包括基于情感感知的数字人表情生成方法,多模态协同的人体姿态估计与动作捕捉、面向多级场景的数字人三维重建与背景融合以及面向多级场景的数字人仿真测试与演示验证。

个人简介:吕科,中国科学院大学特聘教授、博士生导师,国家高层次人才特殊支持“万人计划”领军人才,科技部创新人才推进计划“中青年科技创新领军人才”,北京市高等学校高层次人才引进与培养计划特聘教授,鹏城国家实验室双聘教授,国家重点研发计划“基础科研条件与重大科学仪器设备研发”专项项目负责人,享受国务院政府特殊津贴专家。主要研究方向为图像处理、智能信息处理技术。承担国家自然科学基金、国家重点研发计划、中国科学院仪器设备、北京市教委重大专项等科研项目三十余项。在国内外学术期刊和国际主流会议上发表学术论文150 余篇,出版编著两部。研究成果先后获2004年度、2009年度国家科技进步二等奖、2012年度北京市科学技术二等奖、2012年度中国电子学会电子信息科学技术二等奖, 2017年获得中国科学院(京区)成果转化奖,2021年首届全国博士后创新创业大赛团队银奖。


耿国华

西北大学教授

报告题目:文化遗产数字化赋能文化产业发展

报告摘要:报告阐述文化遗产数字化生存的国家需求,基于先进的智能计算、数字媒体和虚拟现实/增强现实技术,研讨信息技术与文化融合,展现着数字经济的巨大魅力,正在释放文化高质量发展的社会经济效益的巨大能量,给出文化遗产数字化赋能文化产业发展的作用意义。推进文化遗产采集、管理、修复、展示 4 方面服务:研发文物快速采集建模设备技术,解决原真快速建模需求;研发数字博物、虚拟博物、智慧博物,建设文博现代化管理体系;研究颅面虚拟复原、文物虚拟复原体系,引领复原技术革命;研究全息智媒融合、数字孪生虚实展示技术,构建非遗传承新途径;结合团队创新实践,给出产学研领域应用的范例。文化遗产数字化探索创新任重道远。

个人简介:耿国华,西北大学二级教授、博导,国家教学名师,国家高层次人才,全国优秀科技工作者,国务院特殊津贴专家,获CCF杰出教育奖,现任文化遗产数字化国家地方联合工程研究中心主任,全国高等院校计算机基础教育研究会副会长,陕西省计算机教育学会理事长,陕西省计算机学会副理事长。长期从事文化遗产数字化、智能信息处理方向研究成果突出。主持获国家教学成果奖4项,带领国家教学团队,主持国家一流课程、教育部全国高校黄大年式教师团队、教育部虚拟教研室建设,教改成果进课堂,辐射带动作用强。主持973预研、国科金重点等项目,带领团队科技文化融合,结合国博、秦陵、秦腔实践,为文化遗产数字化做出了重要贡献,获国家科技奖及省部级科技奖18项。


张立福

中国科学院空天信息研究院研究员

报告题目:文物多光谱图像采集处理技术与设备

报告摘要:介绍高光谱遥感技术及在文物领域的应用,包括文物高光谱设备研发、便携式高光谱装备研发,以及高光谱分析技术在文物保护、修复、鉴别以及文物数字化装备方面的研究进展。

个人简介:张立福 ,男,博士,研究员,博士生导师,北京大学地理学博士后、地质学博士后。武汉大学摄影测量与遥感专业本科、硕士、博士毕业。曾在日本、澳大利亚等国从事访问学者、高级访问学者研究,现为中国科学院空天信息研究院研员,中国遥感应用协会专家委员会常务委员,国际数字地球学会中国国家委员会委员,ISDE成像光谱专业委员会副主任委员,中国空间学会遥感专业委员会委员,中国载人空间站工程地球科学领域专家组成员,SPIE Member, IEEE Senior Member,并担任30多种国际国内遥感领域核心刊物的特约审稿专家。长期从事高光谱遥感理论及典型应用等面的研究,已在国内外学术刊物上发表科研论文100余篇,其中SCI论文30余篇,EI论文40余篇。主持和作为研究骨干完成或在研国家自然科学基金、863、973等方面的科研项目30多项,发明专利20余项,软件著作权登记8项。曾获得日本《京都市长奖》、新闻出版署科技进步三等奖等奖励。国家重点研发计划项目负责人,所研发的多光谱设备在故宫等得到应用。


论坛联系人

姓名:张加万

单位:天津大学

邮箱:jwzhang@tju.edu.cn

遥感影像智能解译论坛

论坛简介

        遥感影像智能解译是指利用人工智能和机器学习等技术,对遥感获取的影像进行智能化的分析和解释。该方法能够自动识别影像中的地物、地貌和其他特征,提取有用信息并作出相应的推断,有助于环境监测、资源管理、城市规划等领域的应用。本次专题论坛旨在通过研究和探讨遥感影像智能解译相关领域的最新科研成果,邀请在遥感、人工智能领域的多名国内外知名专家,为大家带来一系列在遥感理解领域的前沿研究与先进技术,将通过阐述国内技术的最新研究动态,对这一方向所面临的挑战性问题和可能的解决思路进行较为深入的分析和探讨,提高遥感智能解译领域在国家和国际学术的影响力,促进校企合作和产学研转化。

论坛日程

论坛时间:2024年5月24日09:00-12:20(10:30-10:50茶歇)

论坛名称:遥感影像智能解译

主持人:唐旭

论坛主席

 

焦李成

CSIG会士,西安电子科技大学教授

个人简介:焦李成,西安电子科技大学杰出教授、计算机科学与技术学部主任、人工智能研究院院长,欧洲科学院外籍院,俄罗斯自然科学院外籍院士,IEEE TCYB、IEEE TNNLS、IEEE TGRS、Reaserch副主编、教育部创新团队首席专家,IEEE Fellow、IET Fellow、CAAI Fellow、CCF Fellow、CIE Fellow、CAA Fellow、CSIG Fellow, 连续八年入选爱思唯尔高被引学者榜单。国务院学位委员会学科评议组成员,人社部博士后管委会评议组专家,曾任第八届全国人大代表。1991年被批准为享受国务院政府津贴的专家,1996年首批入选国家级领军人才,陕西省首批“三五人才”第一层次。当选为全国模范教师、陕西省“西迁精神传承人”、陕西省突出贡献专家和陕西省师德标兵。


 

唐旭

西安电子科技大学教授

个人简介:唐旭,西安电子科技大学教授,人工智能学院副院长,IEEE Senior Member。长期从事高分辨率对地观测相关方向的课题研究,面向高分辨率遥感影像理解与应用的重大需求,围绕遥感影像表征学习、内容理解等方面开展创新性的研究。近五年,发表高水平论文80余篇,其中ESI高被引论文4篇。担任国际遥感期刊IEEE GRSL副编辑、Remote Sensing的Topic Editor,多次担任国际地理遥感研讨会分会主席。入选“香江学者”计划、“腾讯犀牛鸟开源人才培养” 计划,入选美国斯坦福大学发布的“全球前2%顶尖科学家榜单”,2022、2023连续两年入选IEEE Geoscience and Remote Sensing Letters最佳审稿人。


论坛讲者信息

张立强

北京师范大学教授

报告题目:城市战争损毁的城市画像

报告摘要:城市战争基础设施损毁的监测犹如池塘捞针。用传统或卫星手段快速精准确定严重损毁区域仍然面临很多技术挑战。为此,本报告介绍一种适合于中、高分辨率卫星图像监测城市损毁方法(TKDS-PtNet)。在叙利亚内战和俄乌战争中,TKDS-PtNet实现了精准的城市建筑损毁监测。即使在中分辨率卫星图像上,TKDS-PtNet的F1-score在叙利亚也高出最新方法44.4(72.4 vs 28.0)、乌克兰高出36.1(84.6 vs 48.5),在此基础上,对叙利亚和乌克兰城市损毁进行了评估。TKDS-PtNet为在数据稀疏环境中的破坏监测提供了一种低成本、可靠、高度灵活的解决方案,可以应用于战争、地震或极端天气造成的城市基础设施损毁监测。

个人简介:张立强 ,目前主要从事GIS时空分析、遥感图像/点云处理等方面的教学和研究工作。先后承担了国家自然基金重大项目课题、国家杰出青年科学基金项目等,研究成果以第一作者/通讯作者发表在Nature Sustainability、Nature Communications、PNAS、Science Bulletin、Remote Sensing of Environment、ICCV等国际著名学术期刊和计算机视觉顶级国际会议上;荣获了日内瓦国际发明展金奖、吴文俊人工智能科学技术创新奖一等奖、测绘科技进步奖一等奖、美国摄影测量与遥感协会(ASPRS)最佳学术论文奖等学术奖励。


 

肖亮

南京理工大学教授

报告题目:多模态遥感数据融合感知与智能解译应用

报告摘要:目前数据-知识-模型驱动的遥感智能感知与解译是时-空-谱多模异质遥感应用研究重要范式。本报告以地学知识、物理模型和数据驱动基础模型为基础,介绍目前模型启发深度融合、地物分类和场景语义描述生成等,并介绍多光谱、高光谱、LIDAR等遥感数据智能融合感知和分析的若干应用进展,以及国产化遥感智能分析平台架构等展望。

个人简介:肖亮,南京理工大学,教授,博士生导师,工学博士,CCF 理事和杰出会员,计算机科学与工程学院副院长,教育部高维信息智能感知与系统重点实验室副主任、江苏省光谱信息感知与系统重点实验室副主任,江苏省计算机学会学术工委执行主任;入选国家级科技领军人才、江苏省青蓝工程学术带头人和江苏省333工程领军科技人才(第二层次)。通过承担国家重点研发课题、科技部重大仪器专项、国家自然基金等国家级任务,研发光谱成像仪器、智能遥感分析与解译系统等,取得行业应用,获江苏省科学技术奖3项,自然资源部国土资源科学奖二等奖3项,中国军民两用技术应用铜奖1项等。近五年,已发表IEEE 汇刊等高水平论文100余篇,出版专著4本,授权专利30余项。


 

王琦

西北工业大学教授

报告题目:面向多源遥感影像的信息智能侦察

报告摘要:多源遥感影像作为空间军事的重要信息保障,是核心的情报来源,对于现代化战争的作用不言而喻。本报告将介绍团队研发的信息智能侦察系统,实现了多源遥感数据的智能解译,为作战指挥提供信息支撑服务。

个人简介:王琦,西北工业大学教授/博导,光电与智能研究院院长。针对图像/视频/大数据分析与理解的具体应用,从事计算机视觉、图像处理、模式识别、机器学习领域的研究。入选国家万人计划科技创新领军人才、科睿唯安全球高被引科学家、IET/BCS Fellow,获中国人工智能学会吴文俊人工智能自然科学一等奖、教育部自然科学一等奖、陕西省自然科学一等奖、霍英东高等院校青年科学奖、高等教育国家级教学成果二等奖等,担任IEEE T-SMC:Systems、T-GRS、T-ITS、T-CSVT等著名国际期刊编委、科技部“新一代人工智能”重大项目管理专家组成员、某军口专家组成员。相关成果在多项国家重大任务中进行了应用示范,解决了一系列技术难题,产生了积极的社会经济效益。


 

张向荣

西安电子科技大学教授

报告题目:记忆机理与关系推理驱动的零样本跨影像高光谱异常检测

报告摘要:高光谱遥感影像异常检测任务中存在异常像元光谱数据未知、背景与异常像元比例极度不平衡等挑战,为此,本报告介绍一种生物记忆机理启发与关系推理驱动的零样本跨影像高光谱异常检测方法。通过设计空-谱协同对比学习框架,实现高光谱遥感影像判别特征表征;充分挖掘场景中潜在类别的语义信息,设计基于最优传输聚类与记忆原型的高光谱遥感影像异常检测算法;结合影像关联关系先验和上下文先验,设计基于局部记忆与关系推理的零样本异常检测架构,实现鲁棒、准确的跨影像高光谱遥异常检测,可应用于矿藏勘探、作物病虫害防治、伪装目标探测等领域。

个人简介:张向荣,女,西安电子科技大学华山学者特聘教授,博士生导师,国家级青年人才,IEEE TGRS副主编,Remote Sensing编委,《自动化学报》编委。2008-2010年在英国贝德福德大学从事博士后研究,2015-2016受美国麻省理工学院(MIT)资助,在MIT计算机科学与人工智能实验室开展合作研究。长期从事模式识别、复杂遥感影像感知与解译领域的教学和科研工作,致力于遥感大数据智能解译的理论与应用研究。先后在本领域著名国内外学术期刊上发表论文100余篇,以智能解译为核心出版专著3部,研究成果获省部级一等奖3项。作为团队负责人,带领的“遥感影像大数据智能解译创新团队”入选陕西省科技创新团队。


 

李彦胜

武汉大学教授

报告题目:遥感大数据智能解译

报告摘要:相对于强大的遥感数据获取能力,海量多模态遥感影像检索发现、信息提取和知识服务能力严重滞后,海量数据堆积与有限信息孤岛并存的矛盾仍然十分突出。本报告尝试探讨遥感大数据的“数据发现-信息提取-知识汇聚”关键技术与转化途径。针对遥感大数据背景下数据找不到、信息提不准、知识挖不全等一系列难题,本报告重点介绍面向海量影像检索的深度哈希网络多模优化与攻击防御技术,面向普适信息提取的多模态多时序遥感基础大模型预训练与顾及地学异质性的隐私保护学习技术,面向时空知识图谱服务应用的多模态知识抽取、融合与推理技术,期望为自然资源调查监测等重大任务提供新的解决思路。

个人简介:李彦胜,武汉大学教授、博士生导师,国家青年人才计划获得者。长期从事遥感时空知识图谱、多模态遥感基础大模型、遥感大数据智能解译研究。主持国家自科基金面上/青年、中国博士后基金特别资助/一等资助、华为、蚂蚁、支付宝、阿里达摩院等项目10余项。一作或通讯发表RSE、IEEE T-CYB、Information Fusion、ISPRS JPRS、中国科学:信息科学、CVPR、AAAI、ECCV等领域顶级期刊会议论文70余篇。荣获中国测绘学会青年测绘科技创新人才奖、中国测绘学会测绘科学技术特等奖、“中科星图杯”高分遥感图像解译软件大赛冠军等荣誉。入选美国斯坦福大学发布的“全球前2%顶尖科学家榜单”。担任IEEE T-GRS、The Innovation等6个国际SCI期刊的副主编/青年编委。


论坛联系人

姓名:唐旭

单位:西安电子科技大学

邮箱:tangxu128@xidian.edu.cn

AIGC的信息隐藏前沿进展论坛

论坛简介

        随着人工智能引领新一轮科技革命和产业变革,生成式人工智能方法同样开花结果,在大众视野中吸引了广泛的关注。同时,生成式人工智能给信息隐藏带来新的机遇和挑战。生成式人工智能技术可以生成自然逼真的文本、图像、音视频等,已经成为虚假信息传播的主要手段,鉴别生成数据的主动水印技术已经成为了研究热点。另一方面,生成模型的训练需要大量的人力、算力,是重要的数字资产,针对生成模型发展模型水印技术也是当前新环境下的一个研究重点。在隐蔽通信方面,传统隐写因自然数据分布不可控,局限于经验安全。生成式人工智能给隐写带来数据分布可采样优势,发展可证明安全成为了可能。

        论坛邀请信息隐藏领域专家学者,共同研讨该领域发展历程、经典框架与应用进展,搭建理论与实践、经验与交流分享的学术桥梁,促进AIGC环境下信息隐藏技术再上新台阶。

论坛日程

论坛时间:2024年5月24日09:00-12:20(10:30-10:50茶歇)

论坛名称:AIGC的信息隐藏前沿进展论坛

主持人:陈可江、周文柏

 

论坛主席

 

俞能海

CSIG副理事长、会士,中国科学技术大学教授

个人简介:俞能海,现为中国科学技术大学网络空间安全学院执行院长,讲席教授,教育部高等学校网络空间安全专业教指委副主任委员,中国图象图形学学会副理事长,中国科学院电磁空间信息重点实验室副主任。主要研究领域为媒体内容安全、数据安全等。近年已主持国家级课题20余项,国家重点研发计划“网络空间安全”专项项目负责人。在“IEEE TPAMI、TIP、TIFS、CVPR、ICML”等知名期刊会议发表高水平论文300余篇。获2021年国家网络安全先进个人奖,2021年安徽省教学名师,2020年军队科技进步一等奖,2019年安徽省自然科学一等奖,2004年国家863先进个人奖,此外获6项省部级科技进步奖,2019年国家网络安全优秀教师奖,2019安徽省教学成果特等奖。


 

谢雪

中国航天系统科学与工程研究院高级工程师

个人简介:谢雪,中国航天系统科学与工程研究院第六研究所副所长,《网络空间安全科学学报》副主编,CSIG数字媒体取证与安全专委会委员、中国计算机学会计算机安全专委会常务委员。主要从事网络安全、信息隐藏、航天科普等相关工作,主持或主要参与军委相关部门、航天科技集团等多项课题研究,曾获全国国企管理创新奖一等奖,第一届中国科技青年论坛奖,中国航天科技集团钱学森青年创新基金,中国航天科技集团科普工作先进个人,中国航天系统科学与工程研究院钱学森奖、优秀论文一等奖、优秀个人奖等荣誉。


论坛讲者信息

 

赵耀

CSIG常务理事、会士,北京交通大学教授

报告题目:可逆信息隐藏

报告摘要:可逆信息隐藏技术是一种能将秘密信息隐藏在媒体数据中以实现信息的秘密通信、版权和内容保护等目的,并可以在提取秘密信息后恢复原始载体的一类信息隐藏技术,该技术得到了国内外学者的广泛关注。本报告将介绍可逆信息隐藏的基本概念,回顾其典型的嵌入方法,并详细介绍本实验室最近的相关成果(Pairwise PEE, Adaptive Pairwise PEE, 基于多直方图的JPEG域可逆水印技术等)。

个人简介:赵耀,长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才。现任北京交通大学信息科学研究所所长,“现代信息科学与网络技术”北京市重点实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数字媒体内容安全,媒体内容分析与理解,人工智能,无人驾驶等。主持了科技创新2030–新一代人工智能专项项目、973计划、863计划等课题30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获世界互联网大会领先科技奖以及北京市科学技术奖一等奖、中国图象图形学学会科学技术奖一等奖、高等学校自然科学奖一等奖等省部级奖励5项。指导的博士生8人获北京市和中国计算机学会等优秀博士论文奖。受邀担任了 IEEE Transactions on Cybernetics、IEEE Transactions on Circuits and Systems for Video Technology等多个国际杂志编委。他是国务院信息与通信工程学科评议组成员,科技部重点研发计划“云计算与大数据”专项总体组专家。


张新鹏

CSIG理事、复旦大学教授

报告题目:从深度模型确权到AIGC溯源

报告摘要:该报告中探讨AIGC兴起背景下信息隐藏的新发展,包括从传统的修改式隐写到图像、文本、图文互鉴的生成式隐写,从多媒体水印到AIGC模型水印,也包括从数据隐藏到网络、驱动和功能的隐藏,成为支撑网络隐蔽空间的重要内容。

个人简介:张新鹏,国家杰出青年科学基金获得者,二级教授。入选上海市东方英才计划领军项目、上海市优秀学术带头人、上海市曙光人才计划、上海市“东方学者”跟踪计划、上海市浦江人才计划、上海市“青年科技启明星”跟踪计划。曾赴美国纽约州立大学宾汉顿分校访问一年,受德国洪堡基金会资助作为资深研究员赴德国康斯坦茨大学访问14个月。主持国家自然科学基金重点项目、国家重点研发计划项目、国家863计划等科研项目40余项。发表论文300余篇,被引18000余次,2014年—2022年连续九年入选“爱思唯尔”中国高被引学者榜单,2020年入选“科睿唯安”全球高被引科学家。申请发明专利30余项,授权近20项。获上海市自然科学奖一等奖、安徽省自然科学奖一等奖、国家级教学成果二等奖。担任 IEEE Trans. on Information Forensics and Security (IEEE T-IFS)等国际学术期刊的 Associate Editor、ACM IH&MMSec 和IEEE WIFS等国际学术会议的主席。


张卫明

中国科学技术大学教授

报告题目:生成式可证安全隐写及其应用

报告摘要:以ChatGPT为代表的生成式人工智能技术快速发展,生成数据在互联网上广泛传播,给信息隐藏带来新的机遇和挑战。本报告将介绍基于生成式人工智能的可证明安全隐写方法、面向生成数据的可证性能无损水印方法及相关应用。

个人简介:张卫明,中国科学技术大学教授、博导,网络空间安全学院副院长。主要研究兴趣包括信息隐藏和人工智能安全。已在国际著名学术期刊和会议IEEE TIT、TPAMI、TIFS、TIP、CVPR、ICCV、NeurIPS、AAAI等发表论文100多篇。主持国家自然科学基金重点、国家重点研发课题、国家863等项目20余项。获得军队科技进步一等奖、安徽省自然科学奖一等奖、安徽省教学成果特等奖、ACM SIGSOFT杰出论文奖。带领团队2019年参加人工智能顶会IJCAI“人工智能算法对抗赛”,获得防御赛冠军和非定向攻击亚军;2020年参加由Facebook、MIT等组织的全球最大的“深度伪造检测挑战赛(DFDC)”,获得亚军,被中国信通院评为2014年以来人工智安全领域的8项中国创新成果之一。


 
 
 

嵩天

北京理工大学教授

报告题目:互联网隐匿传输:信息隐藏视角下的网络协议与架构

报告摘要:以Tor为代表的匿名网络是当代隐私传输的主要载体,随着隐蔽性隐私传输需求的日益迫切,隐匿传输成为重要研究方向。报告针对互联网隐匿传输需求,提出“隐匿网络”概念,以信息隐藏视角,从网络隐匿协议及隐匿架构两个角度,介绍互联网隐匿传输当前研究进展,并结合生成式人工智能最新发展,对信息隐藏及隐写方法提出新的研究建议。

个人简介:嵩天,长聘教授、博士生导师,北京理工大学网络空间安全学院副院长,社会治理智联网技术工业和信息化部重点实验室副主任,中国计算机学会杰出会员,国家重点研发计划项目负责人。主要从事互联网隐匿传输、新一代互联网体系结构等方向研究,主持国家重点研发计划项目1项、国家自然科学基金重点及面上项目6项,发表学术论文90余篇。


论坛联系人

姓名:周钰清

单位:中国航天系统科学与工程研究院

邮箱:wlkjaqkxxb@163.com

多域多维信息智能感知与处理

论坛简介

        人工智能发展的终极目标在于驱动机器透彻感知和理解多域多维的物理世界,包括空域、天域、地域、海域、时间维、空间维、属性维、事件维等。然而,不同平台、不同传感器获取的海量数据数据大都呈现碎片化、信息孤立等问题,而且现阶段的人工智能技术大都仅能感知与处理单一域内的数据或者数据的若干维度,缺乏对多域多维信息进行一体化重建、感知理解与推理,难以为机器透彻感知物理世界提供“全域”信息。为进一步探究和解决该问题,本论坛特邀请领域内多位专家学者,以多域多维信息智能感知与处理为主题,从不同角度对进行分析与研讨,分享各自的成果和观点。

论坛主席

桑农

CSIG理事,华中科技大学教授

个人简介:桑农,华中科技大学人工智能与自动化学院教授,从事计算机视觉和模式识别等方面的研究。中国图象图形学学会理事,中国人工智能学会理事,中国图象图形学学会成像探测与感知专业委员会副主任委员,中国人工智能学会模式识别专业委员会常务委员,中国自动化学会模式识别与机器智能专业委员会常务委员。获省部级一等奖6项,二等奖5项,三等奖2项。


张磊

西北工业大学教授

个人简介:张磊,教授博导,国家级青年人才、中国科协“青托”人才,西北工业大学计算机信息工程系主任。长期围绕太空安全、生态保护等国家重大战略问题,深入研究遥感光学计算成像与图像处理技术。发表论文100余篇,包括中科院SCI分区一区13篇,中国计算机学会(CCF)推荐A类20篇,IEEE会刊20篇。权国家发明专利24项,参与制定团体标准1项。主持国家级项目5项,省部级项目2项。获中国图象图形学学会(CSIG)优秀博士论文奖、ICOT2019最佳论文奖。担任CSIG成像探测与感知专委会秘书长、CAA模式识别与机器智能专委会委员。


论坛讲者信息

刘越

CSIG理事,北京理工大学教授

报告题目:基于手部三维重建的虚拟现实手势交互技术研究

报告摘要:“用手”是人们与外部环境或者物体进行交互的重要方式,计算机视觉技术的进步使得手势交互成为一种非侵入式的新型人机交互接口。然而在现有的手势交互应用中,存在着手部模型参数过于抽象、基于参数模型的手部三维重建方法精度较低、方向手势易产生误识别以及手势漫游交互映射关系缺乏设计指导和用户实验依据等问题。本报告面向手势交互的现实需求,从手部三维重建方法和手势漫游交互两个方面介绍近期的研究成果。

个人简介:刘越,北京理工大学光电学院教授、博士生导师,光电信息技术与颜色工程研究所所长,北京市混合现实与新型显示工程技术研究中心副主任。2000年获吉林大学通信与信息系统博士学位,先后在美国哈佛大学、加州大学伯克利分校、佐治亚理工学院、天普大学以及澳大利亚国立大学等有关实验室访问研究,主要研究领域包括虚拟现实与增强现实、自然人机交互以及计算机视觉等,兼任中国计算机学会虚拟现实专业委员会副主任;中国电子学会虚拟现实产业分会副主任;中国人工智能学会智能交互专业委员会副主任;中国图象图形学学会理事、副秘书长、成像探测与感知专业委员会副主任、三维成像与显示专业委员会副主任;北京图象图形学学会常务理事、秘书长等,目前主持国家重点研发计划项目、国家自然科学基金重点国际(地区)合作项目等多项课题的研究工作,已发表论文100余篇,申请专利50余项,研究成果“交互式显示关键技术及应用”曾荣获国家发明奖二等奖一项。


 

谷延锋

哈尔滨工业大学教授

报告题目:高光谱遥感立体信息获取与处理

报告摘要:高光谱成像是一种获取连续光谱、图谱合一的信息探测技术,与激光雷达、合成孔径雷达被并列为三大对地观测信息获取的核心技术。传统高光谱成像难以获取空间三维信息,导致光谱图像存在空间信息退化、光谱混叠等问题。报告主要介绍当前高光谱遥感立体信息获取、地物立体分类、立体目标检测、立体光谱解混相关方面的进展。

个人简介:谷延锋,国家杰青基金获得者,国家级高层次人才入选者,科技部中青年科技创新领军人才,哈尔滨工业大学电子与信息工程学院副院长,教授、博士生导师,担任中国遥感应用协会理事,黑龙江省天空地一体化智能遥感技术重点实验室主任,IEEE地球科学与遥感汇刊Associate Editor、《中国科学:技术科学》青年编委。长期致力于高光谱遥感信息处理,空间智能信息处理、空天智能遥感研究,主持国家自然科学基金委重点国际合作项目、国家部委重点项目、多次获得省部级科技奖励。


欧阳万里

上海人工智能实验室教授

报告题目:AI4Science-机遇与挑战

报告摘要:以深度学习为代表的人工智能算法取得了飞速的发展,并大规模地应用到人类的生产生活实践中。将人工智能技术应用到科学研究,利用人工智能算法解决当前科学的未解问题已经成为产学研关注的重点。本次报告将介绍上海人工智能实验室在AI4Science研究(包括材料、生物、气象、天文)的既有工作和未来探索。并介绍这些工作与AI解决图像图形领域问题的方法之间的联系。

个人简介: 欧阳万里,上海人工智能实验室领军科学家,实验室科学智能部门主任,曾任悉尼大学电子信息工程学院研究主任。其团队在ImageNet和COCO竞赛多次获得第一。两篇文章入选paperdigest CVPR/ICCV最有影响力的文章。担任人工智能领域顶级期刊TPAMI和IJCV副编,CVPR2023资深领域主席,AAAI24、CVPR2021、ICCV2021领域主席。


 

周喜川

重庆大学教授

报告题目:遥感卫星高通量智能图像处理技术

报告摘要:智能化遥感卫星是当前国内外研究的热点领域,然而高光谱等遥感卫星数据吞吐率普遍在 Gbps级,受卫星载荷算力、通信、信号质量限制,在轨高通量图像处理普遍存在模型算不快、数据传不完与目标看不清的挑战。报告针对“感算传一体”低轨卫星高通量图像处理与传输挑战,系统性介绍团队在星载高通量存算一体智能芯片设计、高能效类脑模型优化、语义无损图像压缩等方面的探索性研究,以实现在轨数据计算与传输效率数量级提升。报告最后将展望国产大模型计算系统在高通量遥感图像处理方面的应用潜力。

个人简介:周喜川,重庆大学微电子与通信工程学院教授,党委书记,类脑感知与普适智能科学研究院负责人(isbi.cqu.edu.cn);兼任RISC-V 国际机器学习与人工智能专业组主席、华为昇思大模型与深度学习技术组主席、AAAI国际人工智能大会程序委员会委员、中国计算机学会集成电路设计专委会执行委员、中国遥感应用协会常务委员、重庆市高等学校交叉学科教学指导委员会委员。主要从事智能信号处理方法与系统设计研究,先后承担嵌入式人工智能领域国家重大专项3项、国家自然科学基金3项、重庆市杰出青年基金、重庆市自然科学基金重点项目,以及华为、中核、中电科集团等头部企业项目的持续。在IEEE TNNLS, IEEE TIP, IEEE TGAS, IEEE TCAS-1等期刊杂志上,以及ICML、AAAI等智能领域国际会议上发表论文100余篇,撰写《Deep Learning on Edge Computing Device》是爱斯维尔首部系统性介绍高通量智能芯片设计、算法优化与系统应用的专著;牵头研发成果OpenGADL深度学习工具软件作为唯一高校牵头发布成果(gadl.com.cn),获2023年国家工信部智赋百业典型案例;自研大脑壳(DANoC)类脑计算芯片获ARM中国匠芯奖;多项成果与专利技术被华为、中核、长安等企业转化应用。先后入选中国电子学会优秀科技工作者,教育部青年长江学者,重庆市英才计划,获重庆市杰出青年自然科学基金资助。


陶文兵

华中科技大学教授

报告题目:大尺度空间三维重建及定位导航

报告摘要:计算机视觉包括两大核心任务:场景语义感知理解与场景三维重建导航,本报告主要从三维重建和定位导航两个方面来介绍场景三维重建导航方面的一些研究工作。在三维重建方面,首先介绍我们在多视图三维稠密点云重建领域的一些研究成果ACMH/ACMM/ACMP/PVSNet/EPNet等,着重强调传统的几何稠密点云重建方法与当前深度学习点云重建方法各自优劣及性能差异;其次介绍我们提出的基于深度学习的点云表面重建方法SSRNet/DeepDT等;然后介绍我们提出的基于几何一致性约束的神经隐式学习表面重建算法Geo-Neus,相比目前代表性的神经隐式表面重建方法有超过20%的大幅度性能提升。在定位导航方面,报告重点集中在其中的核心环节:基于2D/3D特征的两视图位姿估计,主要介绍我们提出的几种两视图位姿估计算法G-Loss/DeTarNet/ SC2-PCR/OIF-PCR等。

个人简介: 陶文兵,华中科技大学人工智能与自动化学院及多谱智能信息处理技术全国重点实验室教授/博士生导师,现担任华中科技大学与杭州市临平区共建的杭州人工智能研究院首任执行院长筹备研究院。曾连续6年入选爱思唯尔中国高被引学者,以第一作者和通讯作者在TPAMI, IJCV, TIP, TVCG, ICCV, CVPR, NeurIPS, AAAI等期刊和会议上发表论文100余篇,授权发明专利50余项,多项研究成果已在企业成功转化应用,产生重大经济价值。近年来研究工作主要集中在以下几个方面:1)提出一系列多视图重建算法在公开数据集上评测取得领先的性能,为工业界广泛采用(代码已开源);2)提出几种深度学习表面重建算法解决了大规模点云表面重建问题,并取得与传统几何算法相当的性能(代码已开源);3)在点云配准领域提出若干性能SOTA的算法(代码已开源)。


论坛联系人

姓名:张磊

单位:西北工业大学教授

邮箱:nwpuzhanglei@nwpu.edu.cn

脑网络组图谱约束的数字孪生脑论坛

论坛简介

        近年来,人工智能和脑科学各自取得了突飞猛进的进展,正改变着人类的生活方式,极大地推动着科技发展和人类文明进步。脑科学研究的前沿进展揭示了脑结构与功能之间的复杂关系,人工神经网络的成功凸显了网络架构的重要性。尽管人们越来越乐观地认为,人工智能将在不久的将来超越人类智能,但这两种智能之间仍然存在巨大差距。基于网络节点和连接的人工神经网络与脑网络组共享基本单元,人类智能的知识可以网络的形式迁移到人工智能中,数字孪生脑以脑网络的形式架设了人类智能与人工智能之间的桥梁。本次学术研讨会秉承“交流、合作、创新”的宗旨,瞄准脑图谱大数据与计算建模,围绕数字孪生脑模型的脑结构和功能基础、神经计算模型构建以及数字孪生脑的应用等各个方面,邀请了4位国内知名专家做专题学术讲座,分享该领域的研究现状和发展趋势,全方位讨论该领域面临的挑战和可能的发展技术路线,共同助力该领域的推广和发展。

论坛时间:2024年5月24日 14:00-17:20

论坛名称:脑网络组图谱约束的数字孪生脑论坛

主持人:蒋田仔

论坛主席

蒋田仔

CSIG理事,中国科学院自动化研究所研究员

个人简介:蒋田仔,中国科学院自动化研究所研究员,脑网络组研究中心主任,脑网络组北京市重点实验室主任。欧洲科学院外籍院士(MAE),IEEE Fellow, IAPR Fellow,AIMBE Fellow。现任国际人脑图谱学会主席,北京脑网络组与类脑智能学会理事长。在Nature Medicine 等刊物发表SCI收录的论文350多篇。获国际神经网络学会终身贡献奖 (Hermann von Helmholtz Award),国际脑电图与临床神经科学学会的最高成就奖(Turan Itil Award),吴文俊人工智能杰出贡献奖,北京市自然科学奖一等奖,国家自然科学奖二等奖等。


兰旭光

西安交通大学教授

个人简介:兰旭光,教授,博士生导师,国家杰出青年科学基金获得者,国务院学位委员会学科评议组成员。2005年12月在西安交通大学模式识别与智能系统专业获得工学博士学位。现任西安交通大学人工智能学院党委书记,研究领域为计算机视觉、机器人学习、多智能体博弈及人机共融协作等。担任中国自动化学会共融机器人专委会主任委员,中国认知科学学会理事、副秘书长,人工智能学会“认知系统与信息处理”专委会副主任委员,仿真学会“智能无人系统建模仿真”专委会副主任委员。在人工智能与机器人领域的著名期刊和会议上如IEEE Trans和ICML/CVPR/RSS等发表论文110余篇,获得国家发明专利授权20余项,出版编著1部。主持国家自然科学基金重点、国家科技重大专项、科技创新2030人工智能重大项目等科研项目10余项,相关研究成果已应用于航天、航空等领域。担任国际期刊IEEE Transactions on Neural Network Learning System、IET《Cognitive Computation and Systems》、《机器人》和《模式识别与人工智能》等期刊的编委。获2023年度高等教育(研究生)国家级教学成果一等奖。曾担任IEEE CYBER2019 和ICIRA2021大会联合程序主席,IEEE RCAR2023大会主席,IEEE 高级会员。


论坛讲者信息

蒋田仔

CSIG理事,中国科学院自动化研究所研究员

报告题目:脑网络组图谱约束的数字孪生脑

报告摘要:脑图谱是理解脑、保护脑、开发脑的基石。我们提出了利用脑连接信息绘制脑网络组图谱的思想,绘制出全新的人类脑网络组图谱,开辟了脑科学和类脑智能的新领域。本报告首先介绍脑网络组图谱的研究背景和研究内容,脑网络组图谱绘制的思想以及与现有脑图谱发的本质区别等方面;然后介绍脑网络组图谱在脑疾病早期预测和精准治疗中的应用;最后介绍脑网络组图谱对数字孪生脑构建的作用并对未来研究方向进行总结和展望。

个人简介:蒋田仔,中国科学院自动化研究所研究员,脑网络组研究中心主任,脑网络组北京市重点实验室主任。欧洲科学院外籍院士(MAE),IEEE Fellow, IAPR Fellow,AIMBE Fellow。现任国际人脑图谱学会主席,北京脑网络组与类脑智能学会理事长。在Nature Medicine 等刊物发表SCI收录的论文350多篇。获国际神经网络学会终身贡献奖 (Hermann von Helmholtz Award),国际脑电图与临床神经科学学会的最高成就奖(Turan Itil Award),吴文俊人工智能杰出贡献奖,北京市自然科学奖一等奖,国家自然科学奖二等奖等。


 

吴思

北京大学教授

报告题目:数据与任务驱动的类脑大模型构建

报告摘要:构建数字化大脑既能帮助我们阐明脑的高级认知功能、解析神经疾病机理,也能帮助我们发展类脑智能,而脑图谱为我们构建数字孪生脑在宏观和介观层次上奠定了结构基础。为了实现这一目标,除了大脑结构和功能数据外,我们还需要发展高效的大脑动力学仿真的编程框架,以及特别适用于大脑的大模型的有效训练方法。本报告将介绍我们课题组在这方面的一些工作进展。

个人简介:吴思,北京大学心理与认知科学学院院长、教授,麦戈文脑科学研究所常务副所长、研究员,定量生物学中心研究员,北大-清华生命科学联合中心研究员,北京智源学者。主要研究方向是计算神经科学和类脑计算,尤其关注大脑信息加工的一般性原理和吸引子模型,并在此基础上发展类脑智能算法。多年来在神经科学顶级期刊和人工智能顶级会议上持续发表大量论文。目前担任计算神经科学领域最大国际期刊Frontiers in Computational Neuroscience的共同主编、中国认知科学学会理事、中国神经科学学会理事、《计算神经科学与神经工程专业委员会》主任等。


练春锋

西安交通大学教授

报告题目:领域知识引导的医学影像机器学习

报告摘要:医学影像计算与疾病智慧诊疗的具体应用过程中,普适机器学习算法和模型的性能往往受限于人体组织的复杂性、疾病早期的隐匿性、高维影像信息的冗余和不确定性等诸多现实挑战。因此,针对特定应用场景,在医学影像机器学习方法的设计过程中引入组织结构/疾病特点等领域先验知识,往往可有效限制假设空间,从而提高模型的精度、泛化性、和影像学可解释性。本次报告将总结和汇报报告人在领域知识引导的医学影像智能计算等相关研究中的初步尝试与应用。

个人简介:练春锋,西安交通大学教授/博导。2017年于法国贡比涅技术大学获计算机博士学位,2017至2020年底于美国北卡罗来纳大学教堂山分校从事博士后研究。专注于医学影像智能计算与机器学习研究。近年来,在Nature子刊、PNAS、IEEE TPAMI/TMI、MedIA、MICCAI、ICCV为代表的高水平国际期刊/会议/专著上发表论文80余篇。目前主持国家科技创新2030—“脑科学与类脑研究”重大项目课题、国家重点研发计划项目“数学和应用研究”重点专项子课题、国家自然科学基金、“陕西省高层次青年人才引进项目”等项目。曾获得获得美国医学物理学家协会AAPM 2018年会Jack Krohmer Junior Investigator奖、AAPM 2015年会John R. Cameron Young Investigator奖提名。担任三个国际期刊(Medical Physics、Frontiers in Radiology、IRBM)的编委,国际会ICPR’22/MICCAI’23领域主席,医学影像机器学习国际研讨会MLMI’22的Leading Co-Chair。

 

陈梁骏

西安交通大学研究员

报告题目:婴儿脑影像智能处理算法及早期脑发育模式研究

报告摘要:随着深度学习算法在医学影像处理和分析中的成功应用,智能婴儿脑影像处理和分析算法也显示出巨大的潜力。然而,智能婴儿脑影像处理和分析算法研究面临以下关键问题:一是由于婴儿大脑MR影像具有组织对比度较低、组织内强度变化大、区域异质性动态变化等特点,现有的面向成人大脑开发的处理分析工具无法很好地应用于婴儿大脑MR影像分析;二是现有针对婴儿脑影像的智能算法缺乏整合,且仍然存在如低对比度婴儿脑影像灰度校正等瓶颈问题有待突破;三是早期人脑皮层下组织和小脑影像还存在均为灰质且相互贴合、结构和褶皱微小且复杂等问题,极大的限制了对这些控制运动、语言、情绪和记忆的重要结构的精确分割和配准。本次报告主要围绕上述关键问题,分享我们在婴儿脑影像智能处理算法开发及早期脑发育模式相关研究的探索与进展。

个人简介:陈梁骏,西安交通大学研究员,校青年拔尖人才项目入选者。2019年获得西安交通大学计算机科学与技术博士学位,并于2019年至2023年间赴美国北卡罗莱纳大学教堂山分校进行博士后研究。研究方向包括智能医学图像分析、脑发育和发育相关疾病诊断、脑机接口、人机混合智能等。发表各类论文19篇,其中以一作身份发表Nature Communications,MedIA,Cell Reports,Pattern Recognition,NeuroImage,Cerebral Cortex,Neurocomputing等中科院Top期刊论文8篇、医学影像顶级会议MICCAI论文2篇,及三作Nature Protocols一篇,授权国内专利四项。


论坛联系人

姓名:罗娜

单位:中国科学院自动化研究所

邮箱:luona2015@ia.ac.cn

文化图像大数据可视化论坛

论坛简介

        图像资料作为一种重要的信息载体,承载着丰富而多样的文化历史信息。历史文化的图像资料包括但不限于古代绘画、雕塑、摄影作品、文物图谱等,记录了文化的演进和历史的变迁,通过大规模的图像数据收集与分析,能够深入了解不同文化之间的联系与差异,推动文化的多元交流与共融。

论坛将从多个角度探讨文化图像大数据的最新研究进展,示可视化技术在文化遗产、艺术图像、历史图像等方面的新成果。

论坛时间:2024年5月24日 14:00-17:20

论坛名称:文化图像大数据可视化

主持人:袁晓如、陈静

论坛主席

袁晓如

CSIG理事,北京大学研究员、长聘副教授

个人简介:袁晓如,北京大学智能学院研究员/长聘副教授,大数据分析与应用国家工程实验室常务副主任。致力于可视化与可视分析通用基础方法与领域应用系统的研究。中国图象图形学学会可视化与可视分析专业委员会主任。

陈静

南京大学副教授

个人简介:陈静,南京大学艺术学院副教授、硕士生导师。主要研究兴趣为:数字人文、数字艺术与数字遗产。发表中英文论文20多篇,主持并参与国际科研项目、国家社会科学基金项目、省部级及校级项目十多项。同时还担任中国索引学会数字人文专委会秘书长、中国文艺理论学会数字人文专委会秘书长及《数字人文》《数字人文研究》《数位典藏与数字人文》期刊的编委。


论坛讲者信息

王晓光

武汉大学教授

报告题目:文化遗产图像基因数据建模与应用

报告摘要:大数据与人工智能技术的助推下,文化遗产领域智慧数据与智能计算成为数智时代文化遗产保护与活化利用的新思路。对文化遗产多模态资源尤其是图像资源的数据化、智慧化加工与服务是其中基础性的核心任务。本报告将介绍武汉大学文化遗产智能计算实验室的目标定位、研究方向和基本情况。围绕文化遗产图像的研究,介绍文化遗产图像语义组织的理论与方法,以及该方法论在敦煌壁画智慧数据建设、文物图像关联聚合平台、图像智能分析、远读可视化等研究与实践中的应用。

个人简介:王晓光,武汉大学信息管理学院副院长,二级教授,博导,文化遗产智能计算教育部哲学社会科学实验室主任,国家级人才称号获得者,国家社科基金重大项目首席专家,中国社会科学情报学会理事、中国音像与数字出版协会常务理事,中国索引学会数字人文专委会侯任主任,国际iSchool联盟数字人文教学指导委员会委员,国际知识组织学会(ISKO)科技咨询委员会委员,《信息资源管理学报》副主编,曾获教育部高等学校人文社科研究成果二等奖,主要研究数字资产管理、信息组织、数字出版、数字人文。


陈为

浙江大学教授

报告题目:智绘文明:大数据可视分析点亮中华传统文化背后的大千世界

报告摘要:本次报告以设计、技术、文化三者角度介绍了课题组面向唐诗宋词国画等文化大数据的可视化和可视分析的作品和系统,系统地以多维度的视角去了解当时的大千世界。

个人简介:陈为,浙江大学求是特聘教授、博士生导师,中国图象图形学学会可视化与可视分析专业委员会委员。现任浙江大学计算机辅助设计与图形系统全国重点实验室副主任。


陈静

南京大学副教授

报告题目:基于博物馆开放数据的数字策展

报告摘要:近年来,全球博物馆开放了大量的博物馆文物图像及元数据,为研究者及爱好者更方便有效地了解、研究人类文明历史提供了新的方式。然而这些数据也存在着元数据标准不一致,数据缺失、错误和分散以及主要以文本语义为主、缺少基于图像分析的数据等问题,对基于文物元数据的研究及再利用也造成了极大困难。本报告从视觉知识生产的角度对全球9个博物馆的80万件文物的图像和元数据进行了数据分析和图像分析,并进行了一系列基于用户策略的策展实践。

个人简介:陈静,南京大学艺术学院副教授、硕士生导师。主要研究兴趣为:数字人文、数字艺术与数字遗产。发表中英文论文20多篇,主持并参与国际科研项目、国家社会科学基金项目、省部级及校级项目十多项。同时还担任中国索引学会数字人文专委会秘书长、中国文艺理论学会数字人文专委会秘书长及《数字人文》《数字人文研究》《数位典藏与数字人文》期刊的编委。


张宇

华为基础软件创新实验室研究员

报告题目:前计算机时代的数据可视化

报告摘要:随着数字化的普及,越来越多历史上有名的可视化作品可以在数字图书馆在线查阅。我们利用多个数字图书馆作为数据源,构建了一个专门收录前计算机时代的可视化的大规模数据集。在数据集构建过程中,我们提出了一个半自动流程,用于从不同数据源获取和处理异构的元数据。我们将讨论这个数据集的应用场景和研究机会,如版本学研究与分类学研究。

个人简介:张宇,现任华为基础软件创新实验室研究员,中国图象图形学学会可视化与可视分析专业委员会委员。他博士毕业于牛津大学计算机系,本科毕业于北京大学智能科学与技术专业。他在人机交互与可视化领域开展工作,主要研究方向为交互式机器学习以及数字人文,相关论文发表于ACM CHI, IEEE VIS, ACM TIIS, IEEE TVCG等会议与期刊。


论坛联系人

姓名:袁晓如

单位:北京大学研究员

邮箱:xiaoru.yuan@gmail.com

生成式人工智能论坛

论坛简介

        生成式人工智能 (Generative AI) 通过机器学习方法从数据中学习特征进而生成全新原创的数据,是AI 从感知理解世界到生成创造世界的跃迁。生成式人工智能通过自动生成内容可以在创意、表现力、迭代、传播、个性化等方面充分发挥技术优势,进而打造新的数字内容生成与交互形态。ChatGPT是其在文本对话的商业化落地案例之一,其商业化发展方向还包括视频和动画生成等。2024年2月,OpenAI最新发布的视频生成模型Sora火爆出圈,将GAI带上新高度,人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。

        生成式人工智能推动视觉内容开发、视觉艺术创作、数字孪生、自动编程等,以及新药物、新物质的预测和合成等。2023年在12月13日,《自然杂志》公布了2023年十大人物名单,破格增加了ChatGPT,用于体现生成式人工智能对科学发展进程的深刻影响。

论坛日程

论坛时间:2024年5月25日14:00-17:20(15:30-15:50茶歇)

论坛名称:生成式人工智能

主持人:赫然

 

论坛主席

赫然

中国科学院自动化研究所研究员

个人简介:赫然,研究员,博士生导师,国际模式识别学会会士(IAPR Fellow)。主要研究方向是模式识别、图像生成和生物特征识别,并应用到异质图像合成与识别、深度伪造与鉴别。研究工作获国家优秀青年科学基金、北京杰出青年科学基金、国自然联合重点基金和中国科学院青年促进会优秀会员等项目支持。在本领域国际主流期刊IEEE T-PAMI和IJCV上发表论文23篇,获IEEE信号处理协会最佳青年论文奖、ICPR最佳科学论文奖、北京青年优秀科技论文一等奖,CSIG自然科学一等奖,中国科学院大学领雁奖、李佩优秀教师奖、朱李月华优秀教师奖,中国科学院优秀导师奖(2022/2023)。指导学生获得IEEE生物特征识别理事会优秀博士论文、北京市优秀博士论文、中国科学院优秀博士论文。担任IEEE TIP/TIFS/TCSVT/TBIOM、Patten Recognition和自动化学报等多个国内外期刊编委,担任NeurIPS/ICML/ICLR/CVPR/ECCV等领域主席10余次。


论坛讲者信息

刘烨斌

清华大学教授

报告题目:基于三维大模型的3D/4D内容生成

报告摘要:三维大模型与视频大模型是当前AIGC的热点,其结合是实现4D内容生成的重要路径。本报告将基于三维大模型(LRM)前沿进展,结合NeRF、3DGS、DMtet等各类三维表征方法,介绍报告人在高质量、快速三维对象生成方面的研究工作;进一步,基于Sora等视频生成模型,介绍4D人体动态生成方面的研究工作。

个人简介:刘烨斌,清华大学长聘教授,国家杰青基金获得者。研究方向为三维视觉、数字人重建、生成与交互。发表TPAMI/ SIGGRAPH/CVPR/ICCV等论文近百篇。多次担任CVPR、ICCV、ECCV领域主席,担任IEEE TVCG、CGF编委,中国图象图形学学会三维视觉专委会副主任。获2012年国家技术发明一等奖(排名3),2019年中国电子学会技术发明一等奖(排名1)。


尤全增

字节跳动研究科学家

报告题目:多模态推理现状和展望

报告摘要:强人工智能(Strong AI)或通用人工智能(AGI)具备抽象推理能力,是下一代AI的目标。近期,大语言模型(LLMs)以及新兴的多模态大型语言模型(MLLMs)领域的进展展示了在广泛的多模态任务和应用中的卓越能力。特别是,不同的多模态模型,有不同的模型架构、训练数据和训练阶段,并且在不同的MLLM基准测试中进行了评估。这些研究在不同程度上揭示MLLMs当前能力的不同方面。然而,MLLMs的推理能力尚未被系统地研究。在这次报告中,我们回顾了现有的多模态推理评估现状,分类并展示了MLLMs推理研究的前沿,介绍了MLLMs在推理任务中的应用趋势。

个人简介:尤全增,目前在字节跳动担任研究科学家,主要的研究课题涉及到多模态领域的模型和推理。在加入字节跳动之前,他在Microsoft Azure Computer Vision担任研究员,主要的研究课题包含多相机多目标的检测和追踪,无人超市,单相机下多目标的追踪等。在博士期间主要研究多媒体内容理解的研究,包含情感分析,社交媒体,计算机视觉等相关的课题。


黄达一

珠海金山办公软件有限公司AI算法经理

报告题目:知识的检索和生成 – 浅谈金山办公在文档问答领域的落地应用

报告摘要:提到AIGC生成式人工智能,大家的第一印象可能主要是文生文、文生图、文生视频等大热场景,其实还存在一个非常重要的应用场景:根据已有的文档通过大模型辅助进行文档阅读和理解,通过算法洞察用户的提问需求,结合已有的文档以及大模型的能力生成符合用户需求的答案。这个过程不像是常规的AIGC主要通过prompt控制大模型生成所需要的内容,而是把大模型当做功能链路中的一环或多环,通过结合CV和NLP小模型形成一个系统性方案,从而实现譬如chatPDF、知识库问答、客服系统等知识检索和再利用的目标。

个人简介:黄达一,男,研究生学历,毕业于英国伦敦大学学院,计算机图像及视觉专业,研究生主要研究领域为:计算机视觉及自动化。现为金山办公AI算法经理。负责OCR、文档识别和理解、PDF编辑、扫描、文档问答等多个重点项目的研发管理工作。团队相关技术成果已在PDF转化、拍照扫描、PDF编辑、WPS AI等多个业务上应用。申请专利十余篇。


李崇轩

人民大学准聘副教授

报告题目:视觉扩散模型前沿进展

报告摘要:扩散概率模型逐步地对先验分布去噪恢复数据分布,可以有效地建模各类视觉数据。本次报告会介绍视觉扩散模型的前沿进展,包括基础架构设计与训练,视频生成、三维物体生成与可控编辑等方面的理论、算法和应用,并简单探讨视觉生成模型的未来发展。

个人简介:李崇轩,中国人民大学高瓴人工智能学院准聘副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作Analytic-DPM、DPM-Solver作为核心采样技术部署于DALL·E 2、Stable Diffusion等。获国际会议ICLR杰出论文奖、吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖、中国计算机学会优秀博士论文、ACM SIGAI 中国新星奖等。入选博新计划、北京市科技新星,主持、参与多项国家自然科学基金、科技部课题。担任ICLR 2024领域主席。


王鑫龙

智源研究院视觉模型研究中心负责人

报告题目:生成式多模态模型:探索与实践

报告摘要:人类在上下文中轻松解决多模态任务的能力(即,只需要一些演示或简单的指令),是当前多模态系统在很大程度上难以模仿的。在这项工作中,我们证明了多模态大模型任务不可知的上下文学习能力可以通过有效的缩放来显着增强。Emu2是一个具有370亿个参数的生成式多模态模型,具有统一的自回归目标,并在大规模多模态序列上进行训练。Emu2表现出强大的多模态上下文学习能力,甚至可以解决需要即时推理的任务,比如视觉提示和基于对象的生成。该模型在少样本设置中设置了多个多模态理解任务的新记录。当对指令进行调整以遵循特定的指令时,Emu2在具有挑战性的任务上进一步实现了最先进的新技术,例如多模态大模型的问答基准测试和开放式主题驱动生成。

个人简介:王鑫龙, 智源研究院视觉模型研究中心负责人。本科毕业于同济大学,博士毕业于澳大利亚阿德莱德大学,师从沈春华教授。他的研究兴趣是计算机视觉和基础模型,近几年研究工作包括视觉感知 (SOLO, SOLOv2),视觉表征(DenseCL, EVA),视觉通才模型(Painter, SegGPT),多模态表征(EVA-CLIP, Uni3D),多模态通才模型(Emu, Emu2)。入选Google PhD Fellowship、国家海外高层次青年人才。


论坛联系人

姓名:段俊贤

单位:中科院自动化所、助理研究员

邮箱:junxian.duan@ia.ac.cn

三维视觉与空天应用论坛

论坛简介

        三维视觉是计算机视觉的一个重要研究分支,其研究内容非常广泛,涵盖深度成像、三维重建、三维目标检测与识别、以及三维场景理解与内容生成等诸多领域,受到广泛关注。近年来,随着三维视觉技术的快速发展,相关成果已在国家空天重大战略需求中得以应用。本次论坛的目的在于汇聚三维视觉、空天应用等研究领域的相关人员,分享三维视觉技术在空天应用中的最新技术进展、面临的困难和潜在机遇,为国内外从事三维视觉研究的专家学者与从业人员创建一个交流与合作的平台。

论坛日程

论坛时间:2024年5月24日 14:00-17:20

论坛名称:三维视觉与空天应用

主持人:陈宝权、杨佳琪

论坛主席

陈宝权

CSIG常务理事、会士,北京大学博雅特聘教授

个人简介:陈宝权,北京大学博雅特聘教授,智能学院副院长,IEEE Fellow和中国计算机学会、中国图象图形学学会会士。研究领域为计算机图形学与可视化,在 ACM SIGGRAPH、IEEE VIS、ACM TOG等国际会议和刊物发表论文 200 余篇。曾担任973项目“城市大数据计算理论与方法”首席科学家,SIGGRAPH ASIA 2014、Intl Conf on 3D Vision 2017和 IEEE Visualization 2005会议主席, ACM Transactions on Graphics (TOG)和IEEE Transactions on Visualization and Graphics (TVCG)编委,现任Computer & Graphics编委指导委员会成员。获得多篇国际会议最佳论文奖,包括2022年ACM SIGGRAPH Asia最佳论文奖、2022年ACM SIGGRAPH最佳论文奖提名、2005 年 IEEE Visualization最佳论文奖等。是2003 年美国 NSF CAREER Award、2014年中国计算机图形学大会杰出奖、2010 年国家杰出青年科学基金、2015年教育部长江学者特聘教授等项目/奖项的获得者。曾任北京电影学院未来影像高精尖创新中心首席科学家、中国计算机学会常务理事和青工委主任、第七届教育部科技委信息学部委员。获电子工程学士(91,西电)、硕士(94,清华),和计算机科学博士(99,纽约州立大学石溪分校)。2020年入选IEEE Fellow,2021年入选IEEE Visualization Academy。

杨佳琪

西北工业大学副教授

个人简介:杨佳琪,西北工业大学计算机学院长聘副教授,博导。他担任空天地海一体化大数据应用技术国家工程实验室多域多维信息系统方向负责人、中国图象图形学学会三维视觉专委会(CSIG-3DV)秘书处成员。主要研究方向为先验和数据匮乏条件下的三维配准重建,致力于提出航天应用背景下的无需训练、适配全国产化平台、轻量化的三维重建算法。近年在IEEE TPAMI、CVPR等CCF A/IEEE汇刊/中国科学院一区的期刊会议发表论文40余篇,指导研一学生获得CVPR 2023最佳学生论文(通讯作者),并获2023年陕西省技术发明一等奖、2023年西北工业大学研究生教学成果特等奖。主持国家自然科学基金面上、国防纵向重点课题等国家级项目和课题5项,参与国防纵向重点项目、国自科联合基金重点等国家级项目10余项。成果常态化应用于航天领域空间碎片三维重建与分析。

论坛讲者信息

吕学斌

四川大学副研究员,四川川大智胜软件股份有限公司副总经理

报告题目:基于MPM技术的高精度3D摄像机与应用

报告摘要:高精度三维摄像机作为空间智能传感设备的基础,广泛应用于三维人脸识别、自动驾驶三维建模、工业自动化中的零件扫描检测和分类、安全领域的目标监测和识别、医疗领域基于微表达的精神疾病辅助诊断等领域。动态结构光是实现高精度三维测量的主要途径,为了制造一种高精度、高帧率、低成本、国产化的动态结构光三维摄像机,团队提出并研发成功了可满足大规模生产的,一种基于MPM技术的高精度3D测量摄像机的核心技术与产品,报告讨论基于MPM动态结构光的高速、高精度3D摄像机的开发所面临的关键技术挑战与解决方案,阐述了高精度3D摄像机的相关应用领域,重点讨论了基于高精度3D摄像机为核心的心理状健康状态监测与筛查机器人的产品与应用。    

个人简介:吕学斌,四川大学副研究员,四川川大智胜软件股份有限公司副总经理。从事多目标跟踪与融合、图像处理、人脸识别、多模态智能感知、计算机视觉、情感计算等领域的理论研究和应用开发工作。先后承担或参与了国家重大仪器专项项目“高速高精度结构光三维测量仪器开发与应用”、国家自然科学基金联合基金项目重点支持项目“三维视觉MEMS动态结构光器件谐振稳定性研究”等项目基础技术研究和产品研制,累计负责孵化开发十多种产品,实现规模性成果转化。目前已在国内外高水平期刊和会议上发表论文20余篇,参编团体标准2项。近两年主要从事如三维微表情智能传感技术等非接触式微动生理指标采集、多模态身心健康状态监测理论与设备研究。

杨必胜

武汉大学教授

报告题目:点云智能理论方法

报告摘要:点云是通过直接/间接测量手段获取的,能够刻画目标表面几何(x、y、z)和属性(纹理、强度等)的密集点集合,已成为物理世界数字化、语义化的重要基础设施。单一来源点云无法全面刻画大范围立体空间的整体特征与功能结构,自动融合多平台点云进行目标精准提取和功能结构的自动转换一直是国际难题和学术前沿。项目组原创了以“广义点云”理论模型为核心的点云智能理论方法, 成果已在深空探测、极地科学、全球双碳、城市可持续发展等领域应用,为科学研究提供了可靠的理论方法支撑;研制了国内首款点云智能处理软件Point2Model,在实景三维中国建设、地质灾害应急监测等国家重大战略及行业领域发挥了重大作用。

个人简介:杨必胜教授,武汉大学测绘遥感信息工程国家重点实验室主任,教育部长江学者特聘教授,国家杰出青年基金获得者,“万人计划” 科技领军人才,科技部中青年科技领军人才,享受国务院政府特殊津贴专家,国家“十四五”、“十三五”重点研发计划项目首席科学家。主要从事点云处理、空间智能、遥感与GIS 应用等方面的研究,担任国际摄影测量与遥感学会点云处理工作组联合主席、ISPRS Journal of Photogrammetryand Remote Sensing 副主编、《测绘学报》编委、《遥感学报》副主编、国际数字地球学会中国国家委员会激光雷达专业委员会副主任委员;获2019年全球Carl Pulfrich奖,作为第一完成人获湖北省自然科学一等奖、测绘科技进步特等奖、湖北省科技进步一等奖、教育部自然科学一等奖各1项,授权发明专利 20 余项,出版学术专著 1 部。

戴玉超

西北工业大学教授

报告题目:动态场景三维重建:优化、学习与生成

报告摘要:动态在现实世界中具有普遍性,从二维图像感知和重建三维动态场景具有重要意义,在自动驾驶、消费级应用、增强现实/元宇宙等方面具有广泛应用前景。动态场景三维重建致力于从连续视频获取所观测场景随时间变化的动态三维结构。动态场景三维重建经历从显式优化方法到神经辐射场隐式表示方法再到最新的深度扩散模型生成方法的发展历程。本报告围绕动态场景三维重建,在显式优化方法下探讨单一物体稀疏重建、多物体稠密重建、复杂场景稠密重建,在隐式学习方法下聚焦动态场景新视角合成和三维重建,最后对于深度扩散模型等生成方法和本领域的开放问题与发展趋势进行展望。

个人简介:戴玉超,男,西北工业大学电子信息学院教授、博士生导师,国家级青年人才。主要研究工作集中在机器视觉、智能感知、图像处理、人工智能等领域,聚焦复杂动态场景的三维重建与感知、深度学习和几何模型融合的稠密匹配、新型仿生视觉传感器和计算成像等问题。主持国家自然科学基金、科技部科技创新2030“新一代人工智能”重大研究计划子课题、JKW领域基金重点项目等科研项目。近年来在TPAMI、IJCV、ICCV、CVPR、NeurIPS、ECCV等国际顶级期刊和会议上发表论文70余篇,谷歌学术引用超过10000次,H因子48。先后获得IEEE CVPR 2012最佳论文奖(大陆高校30年来首次获得该奖项)、陕西省自然科学奖一等奖、中国图象图形学学学会青年科学家奖、火箭军“智箭火眼”人工智能挑战赛全国第一名、CVPR 2020最佳论文奖提名等奖项。担任APSIPA杰出讲者和CVPR、ICCV、ECCV、NeurIPS等国际顶级会议领域主席。

彭思达

浙江大学研究员

报告题目:无需特征检测的图像匹配

报告摘要:图像匹配是众多计算机视觉问题的基石,比如静态与动态场景的重建、物体的定位与跟踪。现有图像匹配器大多依赖于图像特征检测器,导致在弱纹理区域以及动态场景难以获得鲁棒的图像匹配结果。在本次报告中,讲者将介绍一种无需特征检测的图像匹配方法,展示如何在保持高精度匹配的同时提升图像匹配速度,并讨论如何将其拓展到时序匹配以及三维重建。

个人简介:彭思达,浙江大学软件学院“百人计划”研究员。在2023年获得浙江大学计算机科学与技术博士学位。研究方向为三维计算机视觉,代表工作为4K4D、Neural Body、PVNet。至今在TPAMI、CVPR、ICCV等期刊或会议发表三十余篇论文,谷歌学术引用3300余次,其中一篇一作论文获得CVPR最佳论文提名,在GitHub开源获得超过上万个stars。曾获得2023年全球IMC三维重建挑战赛冠军,2023年世界人工智能大会云帆奖-明日之星、2022 Apple Scholar、2020年CCF-CV学术新锐奖、2021年中国CCF图形开源软件奖。

魏明强 

南京航空航天大学教授

报告题目:大型航空装备外形几何处理与分析

报告摘要:随着运-20、C919、蛟龙-600等一批国之重器的面世,我国在大飞机制造方面已实现突破性进展,逐步建立起了相对完整的生产研制体系。但是由于技术基础支撑能力不足,与国际航空制造业巨头相比,我国航空企业尚未能实现制造测量一体化和形成有效的精度调控能力,其中“高精度快速3D扫描分析与质量控制技术”已成为影响我国大飞机研制进程的重要因素。几何深度学习利用其强大的几何特征学习能力,在大飞机外形分析中表现出了良好的潜力。然而,由于现有的网络结构缺乏飞行领域专业性、尚未有公开的大型飞机3D数据集、以及最新的机器学习技术还未能深入移植到几何深度学习领域,导致很难全面高效地对特征复杂、精度要求严苛的大型飞机外形进行分析。本报告将介绍大飞机外形分析中涉及的交叉技术问题。

个人简介:魏明强,教授、博士生导师、国家优青基金获得者、江苏省计算机学会青年科技奖获得者和江苏省航空航天学会青年科技奖获得者,及第14届Chinagraph最佳论文一等奖获得者。博士毕业于香港中文大学并获最佳博士毕业论文奖(2014)。目前为多个期刊的编委/客座编辑,如ACM TOMM、IEEE TMM、计算机辅助设计与图形学学报。近年来,围绕大飞机3D扫描与测量、几何深度学习和三维视觉等研究方向,主持国防基础科研、国家重点研发计划子课题、国自然优青/面上/青年以及联合主持国自然重点项目等10余项;发表学术论文150余篇,如IEEE TPAMI/TVCG/TIP、SIGGRAPH、IJCV、CVPR、ICCV等CCF A类期刊和会议,相关技术用在多个国家重点型号工程。

大模型技术及其前沿应用论坛

论坛简介

        大模型技术近年来已经成为推动人工智能技术革新的一个重要基础性技术,并将对不同的科学研究和产业应用领域产生广泛的影响。本论坛聚焦于大模型研究的最新进展及前沿应用,邀请学术界及产业界嘉宾,介绍大模型前沿技术、大模型加速科学研究、多模态基础模型的最新进展与应用,旨在推动计算机视觉、自然语言处理、基础科学研究及行业应用的跨界融合与技术发展。本次论坛包括5个特邀报告和一个Panel讨论环节,围绕大模型的最新技术进展、前沿应用及未来发展趋势进行深入探讨与交流。

论坛日程

论坛时间:2024年5月26日13:30-16:50(15:10-15:30茶歇)

论坛名称:大模型技术及其前沿应用论坛

主持人:金连文、郭丰俊

 

论坛主席

金连文

CSIG常务理事、华南理工大学教授

个人简介:金连文,华南理工大学二级教授,兼任中国图象图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任、广东省图象图形学会理事长等职。主要研究领域为文字识别、文档图像分析与理解、计算机视觉与人工智能应用等,在权威期刊及国际会议上发表学术论文200余篇,其中SCI一区+CCF A类论文100余篇,Google Scholar论文被引用数14000余次,H-Index 61。连续4年入选斯坦福大学“全球前2%顶尖科学家”年度榜单。获省部级科技奖5项(其中一等奖2项,二等奖3项),荣获CSIG、CAAI、CIE等全国性学会科技进步二等奖3项;指导学生参加国际国内学术竞赛荣获第一名20余次。


郭丰俊

合合信息图像算法研发总监

个人简介:郭丰俊,毕业于上海交通大学,获模式识别与智能系统博士学位,目前为合合信息图像算法研发总监,中国图象图形学学会文档图像分析与识别专委会常务委员,上海市图象图形学会理事。研究领域包括文档图像分析与识别、图像处理、图像安全。带领团队获得ICDAR2023大会文档图像篡改检测竞赛冠军、ICDAR2019大会表格检测竞赛冠军、第三届CSIG图像图形技术挑战赛决赛总冠军,荣获中国图象图形学学会2021年度科技进步二等奖等荣誉。


论坛讲者信息

杨小康

CSIG常务理事、上海交通大学教授

报告题目:AI for science 与大模型

报告摘要:最近几年,人工智能(AI)在多个前沿科技领域取得了显著进展。例如,AlphaFold2实现了蛋白质结构的预测,核聚变智能控制技术,及新冠药物设计等。这些成就标志着AI在科学领域的应用正在逐渐崭露头角。报告将介绍AI for Science这一新兴的研究范式,将围绕如何整合新一代AI的通用性与创造性,以构建新的研究模式,以及如何利用AI改造传统科研设施的问题。深度介绍智能化科研设施,发展科学大模型、生成式模拟、自主智能实验和可信科研协作网络,以促进重大科学发现和技术创新。针对目前需求,介绍运用强化学习、多机协作、联邦学习和生成式AI技术以及整合先进的硬件平台、开发智能化系统,并应用区块链技术,让科研的未来发展方向更具明确性。

个人简介:杨小康,上海交通大学人工智能研究院常务副院长,人工智能教育部重点实验室主任,长江学者、国家杰青、IEEE Fellow。主要研究图像处理与机器学习,获国家科技进步二等奖、上海市科技进步一等奖、国家研究生教育成果二等奖。任中国图象图形学学会常务理事、上海市图像图形学学会理事长。


乔宇

上海人工智能实验室教授

报告题目:“书生”大模型体系

报告摘要:近年来预训练语言大模型推动人工智能技术取得突破性进展,成为通向通用人工智能的重要途径。通用大模型开启了大工程与大创新相结合的新创新范式,极大拓展了人工智能技术与应用的边界。当前,通用大模型正处于从语言向多模态演进的关键阶段,图像、三维等信息的引入将大大拓展模型可以应对的模态和应用场景,同时,也带来重要的技术挑战。这个报告将介绍通用多模态大模型的最新进展,特别是上海人工智能实验室“书生”通用大模型体系,还将分析未来的发展趋势。

个人简介:乔宇,上海人工智能实验室主任助理、领军科学家。从事人工智能领域研究,近年来聚焦通用大模型,领导研发了国内首个广泛覆盖多种视觉任务的通用大模型“书生”,标杆任务性能国际领先。发表学术论文300余篇,累计被引五万千余次,H-index为88。以第一完成人获广东省技术发明一等奖,获CVPR2023最佳论文奖、人工智能旗舰会议AAAI 2021杰出论文奖、世界人工智能大会青年论文奖等。入选国家级人才计划、科技部中青年科技创新领军人才、上海市优秀学术带头人、中国科学院百人计划等。


 

合合信息智能创新事业部研发总监

报告题目:文档解析技术加速大模型训练与应用

报告摘要:在大模型时代,高质量预训练数据的获取速度往往跟不上模型进化的步伐。那么,如何高效获取更多高质量的数据呢?答案在于书籍、教材、论文等高质量文档。然而,这些文档由于格式、版面各异,图文混合、编码多样、有线无线混杂及单双栏等特点,使得文档解析成为一大难题。为解决这一问题,合合研发了TextIn文档解析技术,该技术综合了多种智能文档处理关键技术,能够将全格式的版面文档还原为准确的阅读顺序,支持表格、段落、公式、标题、目录等全文档元素的解析,从而加速大模型的训练与RAG应用。

个人简介:常扬,合合信息智能创新事业部研发总监,复旦大学机器人智能实验室成员。负责合合AI业务线的产品、技术、云服务平台研发工作,为金融、制造、物流等全行业提供智能文档处理产品与解决方案


代季峰

清华大学副教授

报告题目:多模态基础模型研究

报告摘要:

在我们迅速发展的数字世界中,机器理解、解释和创造内容的能力是一个引人入胜的关键主题。今天,我们正见证一个非凡的时代,大型基础模型不仅仅是处理信息,它们正在学习理解和生成具有惊人精度和创造力的复杂语言和图像内容。多模态基础模型,正在重塑我们对人工智能能力的理解。这些模型无缝集成了多种形式的数据,如文本和视觉,它们不仅仅是工具,而是合作伙伴,增强人类的创造力,扩展机器能够实现的领域。在这次报告中,我们将探索这些模型的复杂工作原理,并报告我们研究团队在这个方向上的最新进展。我们将穿越语言和图像的领域,理解这些模型如何理解我们和我们的世界。

个人简介:代季峰,清华大学电子工程系副教授,博士生导师,上海人工智能实验室领军科学家。2014年至2019年在微软亚洲研究院视觉组工作,担任首席研究员、研究经理。2019年至2022年在商汤科技研究院工作,担任执行研究总监,二级部门长。2022年7月加入清华大学电子工程系。在相关领域发表国际期刊、会议文章50余篇,论文总引用3万余次。以可变形卷积为代表的多篇论文被选入深度学习权威框架PyTorch成为标准算子。连续两年获得物体识别领域权威的COCO比赛冠军,之后历届冠军系统也使用了他提出的算法。提出的算法获得自动驾驶感知领域权威的Waymo 2022竞赛冠军,获得CVPR 2023最佳论文奖。视觉领域顶刊IJCV的编委,和视觉领域顶会NeurIPS , ICCV,CVPR,ECCV, ICLR的领域主席,ICCV 2019的宣传主席。


魏忠钰

复旦大学副教授

报告题目:从多模态联合预训练到大视觉语言模型:架构和评测

报告摘要:类GPT-4的“大视觉语言模型”是最近多模态领域的热潮。目前的大模型,包括BLIP-2,MiniGPT4,LLaVA,Lynx等等,已经展现了令人惊喜的能力。这些模型可以回答图片相关的问题,做OCR,理解网上的梗图,但也会产生幻觉(object hallucination)而胡言乱语。本次报告介绍大视觉语言模型发展的三个阶段,即多模态联合预训练、以语言模型为中心的大视觉语言模型和原生大视觉语言模型,并介绍课题组推出的多模态大模型评测基准(Reform-Eval)。

个人简介:魏忠钰,复旦大学大数据学院副教授,智能复杂体系实验室双聘研究员,博士生导师,复旦大学数据智能与社会计算实验室(Fudan DISC)负责人,复旦大学自然语言处理 (Fudan NLP)团队成员。在哈尔滨工业大学本部和深圳校区分别获得学士和硕士学位,香港中文大学博士,美国德州大学达拉斯分校博士后。现任中国中文信息学会(CIPS)情感计算专委会副秘书长、青年工作委员会执委会副主任,中国计算机学会(CCF)自然语言处理专委会副秘书长。担任多个重要国际会议包括EMNLP、ACL的高级领域主席和组织委员会成员。主要研究领域包括自然语言处理和社会计算,主要关注计算论辩和多模态大模型技术,在国内外相关领域高水平会议及期刊发表论文80余篇。曾获得2019年度CIPS社会媒体处理专委会新锐奖,2021年上海市启明星计划,2022年CCF自然语言处理专委会新锐学者奖。


金连文

CSIG常务理事、华南理工大学二级教授

报告题目:OCR基础模型与应用

报告摘要:随着大语言模型的兴起,面向自然语言处理领域的通用人工智能(AGI)取得了重大突破,近年来,视觉基础模型(Foundation Model)及多模态大模型(Large Multi-modal Model)也引起了广泛的研究关注并取得了快速发展,但目前针对光学文字识别(OCR)领域的大模型研究工作报道还不多。本报告将简要回顾近年来多模态大模型和OCR基础模型等相关技术,探讨面OCR的基础模型与多模态OCR大模型的构建方法和可能的技术路线,并对大模型时代OCR技术发展趋势与未来研究方向进行讨论和展望。

个人简介:金连文,华南理工大学二级教授,兼任广东省图象图形学会理事长、中国图象图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任等职。主要研究领域为文字识别、文档图像分析与理解、计算机视觉与人工智能应用等,在权威期刊及国际会议上发表学术论文200余篇,其中SCI一区+CCF A类论文100余篇,Google Scholar论文被引用数14000余次,H-Index 61。连续4年入选斯坦福大学“全球前2%顶尖科学家”年度榜单。获省部级科技奖5项(其中一等奖2项,二等奖3项),荣获CSIG、CAAI、CIE等全国性学会科技进步二等奖3项;指导学生参加国际国内学术竞赛荣获第一名20余次。


论坛联系人

姓名:高天骏

单位:上海合合信息科技股份有限公司

邮箱:tianjun_gao@intsig.net

姓名:朱蓓

单位:上海合合信息科技股份有限公司

邮箱:bei_zhu@intsig.net

三维成像与显示技术论坛

论坛简介

        用三维数据和信息替代二维数据,有效提高视觉感知能力、增强感受体验度,是目前科技的主要发展趋势之一。以目标场景的深度信息为核心特征,实现快速、高清、真实的三维数据获取和显示,可以突破传统二维成像和显示中真实性和沉浸性不足的技术瓶颈,推动信息技术革新,使之更好地应用于消费电子、在线教育、远程医疗、先进制造和智能交通等重要领域,服务于国家战略和产业发展需求。为进一步加强学术交流,推动三维成像与显示技术的发展,集中展示三维成像与显示技术领域的最新研究进展,举办2024中国图象图形大会“三维成像与显示技术论坛”,可以为相关专家学者和产业界同仁以及学生提供相互学习交流和展示创新成果的机会。

论坛日程

论坛时间:2024年5月24日 14:00-17:20

论坛名称:三维成像与显示技术论坛

主持人:王琼华、刘 越

论坛主席

王琼华

CSIG理事,北京航空航天大学教授

个人简介:北京航空航天大学仪器科学与光电工程学院博士生导师、教育部长江学者特聘教授、国家杰出青年科学基金获得者、国家“万人计划”科技创新领军人才、国际信息显示学会、美国光学学会、美国光学工程学会和中国光学学会会士、中国图象图形学学会理事、三维成像与显示专业委员会副主任、PhotoniX等期刊编委、国家重点研发计划等项目负责人。研究方向为显示与成像技术。研制了裸眼3D显示器和连续光学变焦显微镜等,获得数项省部级科技奖励,获准160余件美国和中国发明专利,出版科学出版社书籍3部,发表SCI收录论文350余篇。1988-2001年在电子科技大学获得学士、硕士、博士学位和任职到副教授,2001-2004年在美国中佛罗里达大学做博士后,2004-2018年在四川大学任教授。


刘越

CSIG理事,北京理工大学教授

个人简介:北京理工大学光电学院教授、博士生导师,光电信息技术与颜色工程研究所所长,北京市混合现实与新型显示工程技术研究中心副主任,“十四五”国家重点研发计划“文化科技与现代服务业”总体专家组成员。主要研究领域包括虚拟现实与增强现实、自然人机交互以及计算机视觉等,兼任中国计算机学会虚拟现实专业委员会副主任、人机交互专业委员会副主任;中国电子学会虚拟现实产业分会副主任;中国人工智能学会智能交互专业委员会副主任;中国图象图形学学会理事、副秘书长等,目前主持国家重点研发计划项目、国家自然科学基金重点国际(地区)合作项目等多项课题的研究工作,已发表论文100余篇,申请专利50余项,研究成果曾荣获国家发明奖二等奖1项。


论坛讲者信息

刘怡光

CSIG常务理事,四川大学教授

报告题目:基于黎曼几何的三维信息探测与融合

报告摘要:影像不同目标区域纹理有时类似乃至相同情况;过曝光或复杂光环境常致物理纹理的图像纹理变弱乃至产生伪纹理,影响三维探测性能。为此,以黎曼几何约束为基础,在最优传输框架下,建立了综合极线约束和图像颜色流形微分几何性质的测度;基于最优传输理论,把原始三维数据的位移插值融合视为流形上的拉格朗日泛函优化;在高斯融合法基础上,用周期单调性建立几何度量,进一步提出了周期单调性融合方法。建立的系列方法即使在消费级计算平台上都达到了较好性能,获取6000×4000图像对的三维信息需约500秒。相关成果发表于CVPR2020、ICCV 2021、ACM MM 2022等。

个人简介:刘怡光,四川大学教授(“信息探测与智能感知”岗位长江特聘教授),研究方向主要聚焦于空天信息探测与智能感知。南京理工大学学士(1995)、北京大学硕士(1998)、四川大学博士(2004)、新加坡国立大学博士后(2008)、帝国理工学院访问教授(2011)、密歇根州立大学高级研究学者(2013)。论文100余篇,IEEE汇刊和PR等权威期刊70余篇,SCI收录80余篇。国家发明专利授权26项、计算机软著18项;国家级项目课题10余项,包括国家重大专项课题3项,国家自然科学基金7项(其中重点类项目2项)。获四川省科技进步奖一等奖1次(1/10)和自然科学二等奖1次(1/5)、国际会议IEEE
ICME论文奖2次。《测试技术学报》《激光技术》《中国图形图象学报》编委,中国图象图形学学会常务理事,中国人工智能学会智能融合专委会常务理事,2022中国图象图形大会程序主席。应邀在中国工程院主办的三航论坛,颠覆性技术论坛等做大会报告20余次。国家自然科学基金委员会优青、重点等项目及青长的会评专家,长江/杰青等的通讯评议专家。


赵岩

CSIG常务理事,吉林大学教授

报告题目:基于神经网络的光场显示性能优化方法

报告摘要:近年来,鉴于神经网络在计算机视觉相关领域中的出色表现,也有研究将神经网络引入到一般成像系统和光场显示性能优化中。本报告将主要介绍基于神经网络解决光场显示技术存在的空间分辨率不足、视点间的串扰和透镜像差等问题的国内外研究现状,并简要汇报我们团队相关研究的初步结果。

个人简介:赵岩,吉林大学通信工程学院教授、博士生导师、副院长,主要研究方向包括图像与视频编码、真三维光场成像和数字视觉等。现任吉林省图像图形学会秘书长,中国图象图形学学会常务理事。曾获第九届吉林省青年科技奖。主持国家自然科学基金、国家重点研发计划子课题和吉林省科技发展计划等项目10余项,发表学术论文80余篇,其中包括IEEE TIM,IEEE TVCG,IEEE TCSVT,ICASSP等国际期刊和会议论文,授权国际专利和国内发明专利20余件。


王晓蕊

西安电子科技大学教授

报告题目:三维场景光场表征及数字2D/3D成像应用

报告摘要:自然场景光场表征渲染是3D视景呈现、光电成像、3D显示、人工智能领域的重要研究方向。本报告主要探讨复杂自然环境大规模光学场景多维光场特征建模理论与物理耦合动态渲染仿真方法、场景光场辐射驱动2D/3D光学成像数字建模、及其在2D/3D成像系统研制中的应用等内容。相关技术方法可为3D图像采集、成像显示系统数字化设计、人工智能训练、元宇宙提供支撑。

个人简介:西安电子科技大学教授、博士生导师,国家一流专业建设负责人,陕西省光学学会理事、三维成像与显示专业委员会委员。主要研究领域包括红外光电信息数字工程、集成成像光场显示、集成光信息处理等。主持国家重大专项、大型工业软件子课题、基础加强重点子课题、国防基础预研重点项目、国家自然科学基金、国际合作GRO和研究院所横向合作等课题研究工作,研发的国产自主物理可信三维光学场景软件与全链路光电成像数字工程软件平台已在60余家国防科研院所和部队基地获得推广应用,产生了显著军事效益和经济效益。已发表论文100余篇,撰写2本专著、授权国家发明和国防专利40余项,获得军队省部级奖5项。


王迪

北京航空航天大学副教授

报告题目:3D物体全息图的快速生成方法

报告摘要:全息3D显示能够提供人眼视觉所需全部深度信息,且不存在集合调节冲突所致的立体观看视疲劳问题,具有广泛的应用前景。然而,目前全息3D显示的计算速度非常慢,难以满足实时显示需求,阻碍了其进一步发展。本文提出了两种3D物体全息图的快速生成方法。首先,提出了一种基于全息图优化分割算法的快速全息图生成方法。通过分析全息图的尺寸与有效视区之间的关系,对全息图进行优化计算,使计算速度比优化前提高了51%。然后,提出了一种基于波前记录平面的快速全息图生成方法。该方法在对有效全息图进行计算的同时引入波前记录平面进行加速衍射,以提高传统点源法的计算速度,使计算速度进一步提高了30%以上,实验验证了所提方法的可行性。

个人简介:北京航空航天大学仪器科学与光电工程学院副教授、小米青年学者、中国光学工程学会光显示专委会执行秘书长和中国光学学会全息与光信息专委会委员。长期从事全息3D显示技术研究,主持国家级及省部级项目6项,在Light: Science &Applications、PhotoniX等国际权威期刊上发表SCI收录论文70余篇,ESI热点论文1篇,ESI高被引论文2篇,研究成果被Science、Nature Photonics、Nature Communications等顶级期刊引用和正面评价;授权中国发明专利43件且9件实现成果转化;申请PCT国际发明专利5件,授权美国发明专利1件,合著专著1部《液体光子器件》。


论坛联系人

姓名:邢妍

单位:北京航空航天大学

邮箱:yanxing@buaa.edu.cn

面向虚拟数字人的情感计算论坛

论坛简介

        元宇宙已成为当前学术界和工业界的研究热点,作为元宇宙场景入口与连接纽带的虚拟数字人也备受瞩目。现有数字人技术侧重于利用稠密或稀疏视角图像对数字人进行超写实建模,并通过语音或文本实现与数字人的简单交互,无法实现精准的情感表达。情感计算是人工智能的研究热点,然而现有情感计算技术侧重于分析文本、图像等多模态数据的情感意图,忽视了数字人的细微心理活动和实际应用中的语境和用户个性化影响,在情感识别的准确性、情感生成的自然度和实时性上仍存在诸多挑战。本论坛将邀请数字人和情感计算领域的知名专家,分享传统情感计算与数字人结合的最新进展,并探讨数字人情感计算的挑战、研究方向和初步成果。

论坛日程

论坛时间:2024年5月24日18:30-21:30

论坛名称:面向虚拟数字人的情感计算

主持人:姚鸿勋、赵思成

论坛主席

姚鸿勋

CSIG常务理事,哈尔滨工业大学教授

个人简介:姚鸿勋,哈尔滨工业大学长聘教授,黑龙江省政府特殊津贴专家,教育部“新世纪优秀人才”,AI全球2000位最具影响力学者(AMiner机构发布),哈工大人工智能专业负责人。任中国图象图形学学会常务理事,中国图象图形学学会情感计算与理解专业委员会主任,黑龙江省人工智能学会常务理事,中国计算机学会多媒体专委会委员;主要研究领域为计算机视觉智能、多媒体数据分析与理解、模式识别、情感计算。发表ICCV, CVPR, ACM MM等顶级国际会议及TPAMI, IJCV, TIP, TMM等高影响因子国际期刊文章学术论文 200余篇,H指数>40。


赵思成

清华大学副研究员

个人简介:赵思成,清华大学副研究员,国家级青年人才,哈尔滨工业大学博士,加州大学伯克利分校和哥伦比亚大学博士后。研究方向为情感计算、多媒体、迁移学习等。发表IEEE/ACM汇刊、CCF推荐A类论文60余篇,谷歌学术引用8000余次。担任CSIG情感计算与理解专委会秘书长、NeurIPS/ACM MM/ECCV/AAAI/IJCAI/ICASSP等国际会议的领域主席或资深程序委员、情感计算汇刊IEEE TAFFC编委、IEEE TFS/ACM TOMM等国际期刊的首席客座编辑,获得CSIG优秀博士论文,入选A12000人工智能全球最具影响力学者榜单和全球前2%顶尖科学家榜单。


论坛讲者信息

贾珈

清华大学教授

报告题目:多模态数字人合成技术中的个性化与交互式建模

报告摘要:随着多媒体、计算机图形学以及计算机视觉等领域的迅猛进展,多模态数字人合成技术正日益趋于成熟。同时,通用人工智能(AGI)模型的广泛应用使数字人成为大模型与人类互动的关键媒介,数字人的个性化程度和互动质量对用户体验产生重要影响。然而,实现个性化和交互式的数字人合成仍然依赖于大量手动的建模和动画编辑,这会导致较高的时间和经济成本,从而为数字人的大规模普及带来了一定的挑战。为此,我们着重从个性化和交互式两个方面对多模态数字人进行建模。在个性化方面,我们分别从面部、肢体、语音、文本等多个维度展开小样本个性化数字人合成的研究。在交互建模方面,我们同时从单一数字人、多数字人以及人机互动等多个角度对数字人进行交互式建模。这些研究将进一步降低多模态数字人的定制成本,提高数字人与人的交互质量,为多模态数字人的应用开辟更广阔的前景。

个人简介:贾珈,清华大学教研系列长聘教授,博导,现任清华大学信息学院党的工作领导小组组长、计算机科学与技术系党委书记。她是国家级青年人才称号获得者,主要研究方向为情感计算、人机交互,在领域主要国际会议和期刊上发表了100余篇论文,相关科研成果获得中国电子学会科技进步一等奖、人工智能学会年度优秀成果奖、教育部科技进步二等奖,获得ACM Mutimedia 2023“Brave New Idea Award”、IJCAI 2018“Early Career Spotlight”、2018 年国际计算机学会多媒体专业委员会“ACM SIGMM Emerging Leaders”、ACM Multimedia 2018“Best Demo Award”、日本大川情报基金等多项国际学术奖励以及中国多媒体大会(ChinaMM 2023)最佳论文奖。作为项目负责人,主持科技部重点研发计划重大专项项目等。同时,担任中国中文信息学会理事、中国图象图形学学会情感计算与理解专业委员会副主任、中国计算机学会语音对话与听觉专业委员会副主任、中国中文信息学会语音专业委员会秘书长等职务。


姬艳丽

电子科技大学教授

报告题目:多模态情感认知中的模态协同学习探讨

报告摘要:多模态情感认知研究在多种人机交互场景都有迫切的应用需求,如陪伴机器人与人交互场景、机器人对人的情感理解和情感模仿表达、医疗场合通过情感分析检测职场压力防治抑郁症等。为了实现高效多模态情感认知,设计算法挖掘不同模态间的关联关系和互补信息来促进多模态有效地融合是需要解决的关键问题。为此,我们提出关键模态探索机制,并根据关键模态对其他模态进行信息增强,提高不同模态间的表达一致性和关联性,从而增加多模态融合有效性,提高多模态情感认知准确率。

个人简介:姬艳丽,电子科技大学计算机科学与工程学院教授、博士生导师。研究方向为面向机器人应用的多模态音视理解和人机交互技术。获得28th Australasian Database Conference国际会议Best
Paper Award,第二十届中国虚拟现实大会最佳论文提名奖。入选2023 AI华人女性青年学者榜。组织国际会议和国内学术峰会18余次,学术兼职包括国际会议ACCV2022 Industrial Chair,ACMMM2021 Financial chair,ACMMM Asia 2021 Workshop chair,ICME Registration Chair,国内学术峰会VALSE 2015-2024,以及ACM SIGAI CHINA symposium in TURC, 2017-2019 Local Chair等。中国计算机学会高级会员 (CCF Senior Member),中国图象图形学学会青年工作委员会执行委员、副秘书长,VALSE委员会SAC副主席。


张举勇

中国科学技术大学教授

报告题目:高保真数字人的建模、驱动与编辑

报告摘要:近年来,以NeRF、3DGaussian为代表的表示方式以其强大的拟合表达能力、可微分等优点在人、物体与场景的重建方面取得了巨大的突破。虚拟数字人要真正的走向应用落地,除建模之外,数字人的多模态驱动、外形与情感的编辑与控制等也是同等重要。在本次报告中,我将介绍课题组在虚拟数字人的快速重建、基于物理的动作与衣服驱动、基于文本的外形编辑等方面的研究工作。

个人简介:张举勇,中国科学技术大学数学科学学院教授,获国家基金委优秀青年基金、中科院青促会优秀会员资助。2006年本科毕业于中科大计算机系,2011年博士毕业于新加坡南洋理工大学,2011年至2012年于瑞士联邦理工学院洛桑分校从事博士后研究。研究领域为计算机图形学与三维视觉,近期主要研究兴趣为基于神经隐式表示、逆向渲染与数值优化方法对真实物理世界进行高效高保真三维数字化,以及高真实感虚拟数字内容的创建。


张盛平

哈尔滨工业大学教授

报告题目:超写实虚拟数字人驱动技术

报告摘要:赋予情感的虚拟数字人在元宇宙,虚拟现实等多项应用中发挥着重要作用,而其中,如何通过带有情感的动作信号准确驱动虚拟数字人,是提升数字人真实感和沉浸感的关键问题。因此,为了增强虚拟数字人驱动的准确性与稳定性,我们从二维和三维的不同人体表达出发,挖掘驱动信号与人体表示在不同维度下的关联性,提出基于生成式大模型的可控人体视频生成算法和基于3D高斯的三维人体驱动算法,进而在单目拍摄的视频中学习一个可驱动的二维/三维超写实虚拟数字人表示,为情感动作的精确表达提供高效的载体。

个人简介:张盛平,哈尔滨工业大学长聘教授/博士生导师、青年科学家工作室学术带头人,美国布朗大学博士后、香港浸会大学博士后、美国加州大学伯克利分校访问学者,入选国家级青年人才计划、山东省泰山学者青年专家、哈尔滨工业大学青年拔尖人才计划(副教授、教授)、人社部香江学者人才计划。主要研究方向为3D视觉、虚拟数字人等。主持国家自然科学基金4项、华为公司项目10余项。研究成果获2019年度黑龙江省自然科学二等奖(排名第一)。已发表学术论文80余篇,包括PNAS、IEEET-PAMI、IJCV、ICML、CVPR、ICCV等。


论坛联系人

姓名:赵思成

单位:清华大学

邮箱:schzhao@tsinghua.edu.cn

视觉感知与智能边缘计算前沿与挑战论坛

论坛简介

        视觉感知技术目前已经被广泛应用于安全、交通、医学等多个领域,而智能边缘计算能力的提高推动着嵌入式视觉产业的快速增长,也促进了视觉感知技术在生产、生活等各领域的落地应用。本次论坛将围绕面向边缘计算的视觉感知理论及其在生物医学、海洋探测、航空航等领域的应用,从机理-算法-应用的角度与层次探讨视觉感知与智能边缘计算的当前研究热点、难点与发展方向,着眼于推动边缘智能与嵌入式计算理论和方法体系的构建和发展、提高边缘端智能算法及系统的易用性及效率、加快边缘人工智能技术的实用化和产业落地。

论坛日程

论坛时间:2024年5月24日 18:30-21:30

论坛名称:视觉感知与智能边缘计算前沿与挑战

主持人:张 弘、高会军

论坛主席

张弘

CSIG理事、北京航空航天大学教授

个人简介:张弘,北京航空航天大学教授,博士生导师。长期从事人工智能、模式识别、图像分析及理解、计算机视觉等研究,取得了一系列原创性成果,在智能边缘系统设计及在线自主学习、轻量化小样本目标检测跟踪方面取得了突破性的进展,相关成果获得了80多项发明专利,成果排名第一获得国家科技进步二等奖及教育部技术发明奖一等奖。近年承担了国家科技部重点研发计划、国家自然基金等项目50多项。在高水平期刊和会议上发表论文100余篇。出版国家规划级教材两本。

高会军 

哈尔滨工业大学教授

个人简介:高会军,哈尔滨工业大学航天学院教授、博士生导师,智能控制与系统研究所所长;欧洲科学院院士、长江学者特聘教授、国家杰出青年基金获得者、IEEE Fellow、香港大学荣誉教授;曾任全国青联常委、黑龙江省青联副主席。研究方向为智能控制、显微成像、类器官制造等。获国家自然科学二等奖、全国先进工作者、中国青年五四奖章、中国青年科技奖、陈嘉庚青年科学奖、科学探索奖等荣誉。任IEEE工业电子学会副主席、IEEE机电一体化汇刊主编,获IEEE诺伯特·维纳奖、IEEE尤金·米特尔曼成就奖。培养的多名学生入选国家高层次人才计划。


论坛讲者信息

高会军

哈尔滨工业大学教授

报告题目:面向体外组织再生的三维显微成像技术

报告摘要:组织再生技术可以在体外培养与人体内组织器官结构与功能相近的细胞组织,已在生物医学领域展示出巨大的应用潜力,成为了国际研究的前沿焦点。本报告介绍面向体外组织再生的三维显微成像技术。针对组织再生过程中细胞组织的姿态调整难、成像维度低、分辨率受限等难题,基于显微操作和计算光学相关技术,研究声场与流体场混合驱动的显微操作控制方法、多角度显微成像技术、多光路融合三维重构理论,建立面向体外组织再生的三维显微成像系统,推动体外组织再生技术在药物研发、疾病诊疗、生物制造等生物医药领域的重要应用。

个人简介:高会军,哈尔滨工业大学航天学院教授、博士生导师,智能控制与系统研究所所长;欧洲科学院院士、长江学者特聘教授、国家杰出青年基金获得者、IEEE Fellow、香港大学荣誉教授;曾任全国青联常委、黑龙江省青联副主席。研究方向为智能控制、显微成像、类器官制造等。获国家自然科学二等奖、全国先进工作者、中国青年五四奖章、中国青年科技奖、陈嘉庚青年科学奖、科学探索奖等荣誉。任IEEE工业电子学会副主席、IEEE机电一体化汇刊主编,获IEEE诺伯特·维纳奖、IEEE尤金·米特尔曼成就奖。培养的多名学生入选国家高层次人才计划。


魏志强

中国海洋大学教授

报告题目:重点海区高分海洋大数据与智能计算系统

报告摘要:全球重点海区动态、精准的环境大数据,因其在海洋经济中具有不可替代性而成为战略资源。但由于海洋是高度复杂而又动态耦合的系统整体,重点海区长期受困于观测网络布控、海量数据管理和巨量算力使用等等感存算一体化挑战,导致了服务于海洋活动的大量重要环境数据基础设施急需建设。围绕重点海区精准感知、海量存储和巨量计算等相关技术,相关报告针对:如何构建近海高精度定标网和深海大洋漂流浮标网一体化的协同感知体系?如何构建面向跨圈层、跨尺度、跨模态的时空耦合、特征关联和数据超分等数据处理体系?如何构建面向海洋应用的国产超大规模并行计算体系?等阐述相关的技术思路及取得的部分成果。

个人简介:魏志强,教授,博士生导师,中国海洋大学副校长、国家发改委海洋大数据国家地方联合中心主任,主要从事海洋多模态大数据与人工智能方面的研究。主持国家重点研发计划项目、国家自然科学基金、国家863计划、国际合作重点项目等国家及省部级科研项目30余项,在海洋大数据领域顶级国际会议和期刊等发表高水平论文200余篇,授权发明专利及软件著作权100余项,建成新一代智能超算大科学基础设施。作为第一完成人,获智能计算与智能信息系统领域省部科技进步一等奖3项。入选国家高层次人才计划、海洋大数据国家级创新团队负责人等。


邱国平

深圳大学教授、英国诺丁汉大学教授

报告题目:从外观审美到深度理解–机器学习在视觉信息处理中的应用

报告摘要:本次报告将重点介绍课题组在应用机器学习和人工智能生成数据和评估视觉美观、理解卫星和街景图像以及对医学图像进行分类方面的最新研究工作。

个人简介:邱国平,深圳大学电子与信息工程学院特聘教授、深圳大学智能机器人中心主任、英国诺丁汉大学视觉信息处理教授。曾在英国和香港的大学任教,并为欧洲、中国香港和中国内地的跨国公司提供咨询服务。研究领域包括图像处理、模式识别和机器学习,特别在高动态范围成像和基于机器学习的图像处理技术方面展开了开创性研究。发表了大量的研究论文,并拥有多项欧洲和美国专利。研究成果促成了一家独立公司的创立,该公司生产的先进数码摄影软件屡获殊荣,被全球数千万用户所使用。


张弘

CSIG理事、北京航空航天大学教授

报告题目:复杂环境自主成像探测关键技术及应用

报告摘要:随着技术进步,智能算法和智能芯片正在向边缘计算领域快速发展,智能图像处理等海量数据计算任务,已逐渐从传统云端服务器下沉到实时高效的边缘端。图像智能边缘计算融合了计算机视觉、人工智能、智能芯片等诸多学科方向交叉,有着广泛的应用空间,如遥感航天,工业监控,智慧城市,无人驾驶等。报告将围绕边缘端人工智能视觉计算领域,重点探讨强资源约束及算力受限条件下的智能成像探测技术,介绍边缘端智能探测、智能感知及智能感算的现状和发展趋势。

个人简介:张弘,北京航空航天大学教授,博士生导师。长期从事人工智能、模式识别、图像分析及理解、计算机视觉等研究,取得了一系列原创性成果,在智能边缘系统设计及在线自主学习、轻量化小样本目标检测跟踪方面取得了突破性的进展,相关成果获得了80多项发明专利,成果排名第一获得国家科技进步二等奖及教育部技术发明奖一等奖。近年承担了国家科技部重点研发计划、国家自然基金等项目50多项。在高水平期刊和会议上发表论文100余篇。出版国家规划级教材两本。担任中国图象图形学学会理事、图像智能边缘计算专委会主任。


论坛联系人

姓名:袁丁

单位:北京航空航天大学

邮箱:dyuan@buaa.edu.cn

类脑计算:面向未来的机遇与挑战论坛

论坛简介

        类脑视觉是借鉴生物视觉系统的神经网络结构和信息加工机理而建立的一套新的视觉信息处理理论、技术、标准、芯片和应用系统。采用深度学习对静态图像和图像序列(视频)分类识别的性能已经很高,但在视觉主动性和灵活性方面还远远不及生物。破解生物视觉的奥秘一直是机器视觉研究的梦想,但是,至今对生物视觉的已知还远远小于未知,机器视觉研究至今还未跳出持续五十多年的“视频摄像头 + 计算机算法”基本范式。近年来生物成像技术的快速发展,“看清”生物视觉系统的精细神经结构和信号加工过程正在成为现实,我们对生物视觉理解的科学前沿正在快速推进,类脑视觉面临实现重大突破的机遇,有望赋予智能系统像人类一样感知环境、性能远超人类的真正视觉系统,从根本上重塑视觉信息处理的理论和技术体系。   

论坛日程

论坛时间:2024年5月24日 18:30-21:30

论坛名称:面向未来的机遇与挑战

主持人:王  威

论坛主席

黄铁军

CSIG理事、北京大学教授

个人简介:黄铁军,北京大学信息科学技术学院教授,计算机科学技术系系主任,数字媒体研究所所长,数字视频编解码技术国家工程实验室副主任,北京智源人工智能研究院院长,中国图象图形学学会类脑视觉专委会主任,中国人工智能学会会士(2019),中国计算机学会会士(2019)。国家杰出青年科学基金获得者(2014),教育部长江学者特聘教授(2015),“万人计划”科技创新领军人才(2018)。主要研究方向为视觉信息处理与类脑视觉。发表学术论文200多篇,专著两部,授权发明专利50多项,作为主要起草人制定5项国家标准和7项IEEE标准。在视频背景建模与编码、目标检测与分析、视觉特征表达与识别等方面取得多项成果,提出的基于背景建模的监控视频编码方法将压缩效率提高一倍,领先国际标准。积极推过我国类脑计算方向发展,研制出速度超人眼千倍的超速全时仿视网膜芯片。荣获国家技术发明二等奖(2017,第1 完成人)、国家科学技术进步二等奖两次(2012第2完成人,2010第四完成人)和中国科协求是杰出青年成果转化奖。


唐华锦

浙江大学教授

个人简介:唐华锦,浙江大学计算机科学与技术学院教授、博导。2005年毕业于新加坡国立大学电气与计算机工程系获博士学位。2004-2006年工作于意法半导体有限公司,2006-2008年于澳大利亚昆士兰大学脑科学研究所从事博士后研究,2008-2015在新加坡科技研究局工作。先后于2014-2020在四川大学计算机学院、2020-至今在浙江大学计算机科学与技术学院工作。聚焦类脑计算、人工智能、智能机器人研究,主持国家自然科学基金、科技部科技创新 2030-“新一代人工智能”重大项目等多个项目。研究成果被国际科技媒体MIT Technology Review,Communicaitons of ACM等报道。由Springer出版英文专著两部,获2016年度IEEE Trans. On Neural Networks and Leanring Systems 优秀论文奖、2019年度IEEE Computational Intelligence Magazine优秀论文奖。申请人担任了IEEE Trans. On Neural Networks and Leanring Systems (2012-2018)、IEEE Trans. on Cognitive and Developmental Systems、Frontiers in Neuromorphic Engineering,Neural Networks, Neuromorphic Computing and Engineering等期刊编委。


论坛讲者信息

彪晓卫

航天五院西安分院数传所副所长

报告题目:脉冲神经网络:模型与学习算法

报告摘要:本次报告将聚焦天基智能计算发展现状及挑战,分享当前天基智能计算领域的发展现状,结合卫星互联网技术发展等新型需求,分析天基为什么需要云计算,并介绍近年来团队在天基云计算领域的研究成果,最后针对该新兴领域需求,分享从天地计算架构、基础软硬件方面的发展及挑战。

个人简介:彪晓卫,航天五院西安分院,数传所党总支书记/副所长,长期从事数据链系统和卫星高速数传系统研究工作,参与国家空间基础设施多个重大专项的研究论证,组织完成百余项预研课题,主持完成10余项国家重点型号分系统总体设计,参与多个国家重要航天型号任务高速数传系统研制工作,推进了卫星载荷的智能化发展,技术水平达国内领先、国际先进,具有丰富的科研工作经历和工程实践经验,获得各类表彰及奖励10余次。


余磊

武汉大学教授

报告题目:融合类脑事件脉冲的视频增强

报告摘要:事件相机通过将场景的光强变化转换成脉冲事件来感知信息,异步输出反映场景光强变化的事件流。相较于传统的视觉感知方式,事件相机具有极低的延时和极高的动态范围,在成像、目标检测、定位和三维重建等方面具有广阔的应用前景。而得益于其极高的时间分辨率,事件相机能有效补偿视频场景中的运动模糊导致的视觉纹理和几何运动信息缺失,因此融合事件流的运动模糊图像重建逐渐成为解决复杂高速非均匀运动模糊问题的关键技术。报告将介绍课题组在融合事件的视频增强任务的近期研究进展,并进一步探讨事件相机在该领域的应用前景。

个人简介:余磊,武汉大学电子信息学院副教授,博士生导师,湖北省“楚天学子”,武汉大学“珞珈青年学者”。曾先后在法国国家信息与自动化研究所(INRIA)和美国杜克大学访问交流。长期从事信号与信息处理相关领域的研究,主要研究兴趣为稀疏信号处理、类脑视觉感知和信息表征处理。主持国家自然基金项目2项,在相关领域顶级期刊(TPAMI、TMM)和会议(CVPR、ICCV、ECCV)上发表论文50余篇,其中1篇论文被选为CVPR 2021最佳论文候选。


张宝昌

北京航空航天大学教授

报告题目:解耦因果学习方法与应用

报告摘要:深度学习在解决实际问题中获得成功应用,但是其模型参数耦合程度高、具有很大不确定性,影响模型的优化和泛化。为了解决相关问题提出解耦因果学习方法,基于因果关系与参数解耦实现了模型的可靠因果关系,从而提升机器学习方法的可靠性与鲁棒性。提出了协同梯度下降算法,以双线性模型为例,构建解耦因果学习模型。为了提升模型的有效性,提出了一系列模型压缩方法,在降低模型复杂度的情况下,提高模型容量和模型的泛化能力。相关的应用包括:单比特模型压缩、目标识别等。

个人简介:张宝昌,主要从事机器学习、计算机视觉、频谱感知等领域研究,发表录用IEEE汇刊、CCF A期刊和会议等论文近300篇,2篇入选热点论文和5篇入选高引论文,一作单篇论文谷歌引用1270次。入选爱思唯尔(Elsevier)中国高被引学者,教育部新世纪优秀人才项目、深圳市海外高层次人才计划团队项目、江西省千人计划项目、百度深度学习实验室学术顾问、中关村国家实验室核心双聘人员,获得一级学会/省级自然科学奖4项(三项一等奖)和国际重要比赛第一名3项(ECCV和ICPR)。  


申江荣

浙江大学助理研究员

报告题目:基于选择性注意力的脉冲神经网络连续学习方法

报告摘要:下一代机器智能的发展需要具备持续学习的能力,以获取新知识而不忘旧知识,同时也需要保留有限的计算资源。脉冲神经网络(SNNs)因其更接近生物神经元的动力学特性而备受关注。受到生物系统中上下文门控机制的启发,提出采用选择性激活机制实现持续学习的SNNs模型。该模型结合了基于Trace的K-Winner-Take-All(K-WTA)和可变阈值组件,形成了在时空维度上的选择性激活稀疏性,促进了神经元的子群体激活以执行特定任务。通过在网络中不同神经元群体之间路由不同任务,实现了持续学习的维护。另一方面,多模态SNNs的优化对于提升能效和性能具有重要意义。然而,由于不同模态之间的不平衡性,导致了性能下降。因此,提出了平衡多模态BM-SNNs模型,引入了在线损失调整(LA)算法和时间对齐(TA)模块,实现了跨多模态的平衡训练。

个人简介:申江荣,浙江大学助理研究员,脑机智能全国重点实验室研究骨干,英国莱斯特大学荣誉访问学者。长期从事脑科学与人工智能的交叉结合研究工作,特别是脑启发的类脑计算模型构建中的模型构建、学习算法、编解码等关键问题。目前已在人工智能顶级会议/高质量期刊如TNNLS、AAAI、CVPR、NeurIPS发表论文十余篇;主持国家自然科学青年基金、博士后特别资助(站中)等;作为子任务负责人参与国家重点研发计划等。曾获首届全国大学生类脑计算大赛二等奖、广东省研究生学术论坛类脑计算专题Abstract Awards一等奖等,曾多次受邀参加类脑计算领域国际会议,并发表大会口头报告/海报展示等。长期担任计算机领域和神经科学领域重要期刊或顶级会议的审稿人,包括AAAI 2023 PC Member等。


郑乾

浙江大学研究员

报告题目:脑启发的计算模型及算法研究

报告摘要:本次报告将聚焦类脑计算算法领域面临的两个挑战:模型构建算法的性能优化和具体应用算法的性能提升。在模型构建方面,将分享课题组在脉冲神经网络(SNNs)构建算法的最新进展,包括面向计算机视觉任务的通用构建算法,和针对硬件资源受限场景的动态功耗模型构建算法。在具体应用方面,报告将介绍类脑算法在三维重建任务中的性能优势,和展示类脑相机在室内光源估计任务中的二义性消除优势。这些研究内容在一定程度上表明了类脑计算算法在提高计算效率、降低能源消耗和优化信息表征方面的潜力,展现了其在未来技术发展中的重要价值。

个人简介:郑乾,浙江大学“百人计划”研究员、博士生导师。于浙江大学获得学士、博士学位,曾在新加坡南洋理工大学ROSE实验室从事博士后研究。入选2021年国家高层次青年人才引才计划,发表CCF A类论文30余篇,主持2项国家自然科学基金,是国际期刊Neurocomputing副主编, PRCV 2023领域主席,10余个CCF A类期刊或会议审稿人,第七届VALSE执行领域主席委员会副主席。


论坛联系人

姓名:王威

单位:北京通用人工智能研究院研究员

邮箱:wangwei@bigai.ai

三维点云数据智能理解和重建论坛

论坛简介

        三维场景蕴含了丰富的三维几何信息、视觉信息和知识信息。基于RGB图像的三维场景重建技术已经有广泛深入的研究,但仍然难以充分表达三维场景的全部信息,特别是由于缺乏空间深度信息,使得重建结果不完整,存在歧义性、精确度低等瓶颈问题。近年来,得益于人工智能技术的重大突破和深度相机的广泛普及,可便捷地获得大量三维点云数据,这使得基于语义理解的三维场景重建成为新的发展趋势。面向三维点云数据的智能理解和重建技术,旨在通过层次化解析“场景-物体-部件”语义,理解场景细粒度知识信息,解决歧义性与场景残缺问题,以更为高效地构建复杂与富有多样性的三维场景,为VR/AR、无人驾驶、机器人视觉等重大应用提供强有力的技术支撑,具有重要理论意义与应用价值。本论坛由数字娱乐与智能生成专委会承办,邀请了学术界专家介绍三维点云数据智能理解和重建技术的最新研究进展,并将对未来发展方向进行深入讨论。

论坛日程

论坛时间:2024年5月24日18:30-21:30

论坛名称:三维点云数据智能理解和重建

主持人:马利庄 上海交通大学

 

论坛主席

马利庄

CSIG理事、会士,上海交通大学教授

个人简介:马利庄,上海交通大学特聘教授、上海交通大学人工智能研究院副院长,华东师范大学特聘教授,博士生导师。中国图象图形学学会会士、理事、数字娱乐与智能生成专业委员会主任,中国人工智能学会理事、“智能创意与数字艺术专委会”副主任,CAD&CG专委会副主任。马利庄博士是国家杰出青年基金、上海市科技进步特等奖(第一完成人)、一等奖、二等奖,中国青年科技奖,国家教育部科技进步二等奖;国家“百千万人才工程”(国家级)首批人选,浙江省跨世纪学术与技术带头人,国务院特殊津贴获得者。马利庄博士多年来在计算机图形图像、计算机视觉、数字媒体、智能信息处理等领域前沿问题积极探索,取得了一系列创新性成果,在国内外重要学术刊物上发表论文300多篇。


论坛讲者信息

马利庄

CSIG理事、会士,上海交通大学教授

报告题目:服务机器人发展与展望

报告摘要:AI技术大爆发,机器人应用场景持续扩展,助推行业数字化转型,机器人生态加速共融共生,引领智能产业发展。本报告围绕机器人的硬件、本体、大小脑、交互等发展历史展开。下一代结合AI技术的控制系统也在逐渐发展,以计算机视觉为代表的AI驱动机器人智能控制系统,要求机器人具备“看”和理解图像和视频视觉感知、规划与推理的能力,也要求机器人具备文本分析、语义理解的能力,多模态大模型为实现机器人感知提供新方案。未来,以服务型机器人为代表的机器人领域将孕育新蓝海,人形机器人将进入千家万户,增量经济潜力无限!

个人简介:马利庄,上海交通大学特聘教授、上海交通大学人工智能研究院副院长,华东师范大学特聘教授,博士生导师。中国图象图形学学会会士、理事、数字娱乐与智能生成专业委员会主任,中国人工智能学会理事、“智能创意与数字艺术专委会”副主任,CAD&CG专委会副主任。马利庄博士是国家杰出青年基金、上海市科技进步特等奖(第一完成人)、一等奖、二等奖,中国青年科技奖,国家教育部科技进步二等奖;国家“百千万人才工程”(国家级)首批人选,浙江省跨世纪学术与技术带头人,国务院特殊津贴获得者。马利庄博士多年来在计算机图形图像、计算机视觉、数字媒体、智能信息处理等领域前沿问题积极探索,取得了一系列创新性成果,在国内外重要学术刊物上发表论文300多篇。


郭裕兰

国防科技大学副教授

报告题目:标签高效的点云特征学习

报告摘要:作为表征真实世界的重要数据模态,三维点云在机器人、自动驾驶、AR/VR、遥感测绘等诸多领域有广阔应用前景。在点云数据获取越来越便捷的同时,依然面临点云数据标注难的挑战,从而严重制约了点云数据的大规模应用。为此,如何实现弱标签或无标签情形下的点云语义理解,已成为亟需解决的难点问题。在本报告中,将重点汇报报告人在弱/无监督条件下的点云特征学习研究进展,及其在点云语义分割和动作识别等领域的应用探索。

个人简介:郭裕兰,主要研究领域为三维视觉,包括三维重建、点云语义理解及点云压缩编码等。在IEEE TPAMI和CVPR等期刊和会议发表学术论文170余篇(其中IEEE TPAMI论文10篇),ESI高被引论文8篇,谷歌学术总被引1万余次,连续三年入选Elsevier中国高被引学者,入选全球前2%顶尖科学家榜单、百度全球华人AI青年学者,获吴文俊人工智能优秀青年奖、ACM China SIGAI Rising Star。担任中国图象图形学学会三维视觉专委会秘书长,IEEE Transactions on Image Processing、Computers & Graphics、Visual Computer等国际学术期刊编委,CVPR 2023/2021、ICCV 2021、ECCV 2024、ACM Multimedia 2021等国际会议领域主席。


胡瑞珍

深圳大学教授

报告题目:三维室内场景自主重建

报告摘要:三维场景重建在许多领域都有着极大的应用需求,然而传统人工扫描效率低下,相对而言,机器人对三维场景进行自主重建要更加可靠和可控。然而,对未知室内场景进行高效、高质量的自主扫描重建是一项极具挑战性的任务,包括实现对不可见内部结构的物体进行交互式探索与扫描、对未知区域的快速探索与已知区域的精细扫描的决策平衡、对多机器人协同扫描的高效任务分配等。本报告将围绕上述挑战,从不同切入点介绍一系列三维室内场景机器人自主重建方面的工作。

个人简介:胡瑞珍,深圳大学特聘教授,博士生导师,国家优秀青年科学基金、广东省杰出青年项目获得者。研究方向为计算机图形学,长期从事智能几何建模与处理方面的研究,发表 ACM SIGGRAPH/TOG
论文二十余篇;入选中科协青年人才托举工程;荣获亚洲图形学协会青年学者奖、全国几何设计与计算青年学者奖;担任期刊IEEE TVCG、IEEE CG&A和Computers & Graphics等国际期刊编委;担任国际会议SGP 2024、CVM 2023和SMI 2020程序委员会主席,连续多年担任SIGGRAPH等大会程序委员会委员;担任中国计算机学会计算机辅助设计与图形学专委会副秘书长、计算机图形学与混合现实在线平台(GAMES)线上活动运营负责人。


杨 旭

西安电子科技大学电子工程学院精英副教授

报告题目:开放场景下的机器推理研究

报告摘要:近年来,以深度学习为代表的人工智能技术在人类生产生活中的各个领域都取得了惊人的进展,表现出逼近或超越人类的性能。然而,深度模型的泛化能力高度依赖于训练数据与测试数据之间的“独立同分布”假设,但是真实世界中存在标注成本高昂、数据分布不均、领域知识困难等诸多数据标注难题,因此上述假设往往难以满足,严重制约了深度学习在开放世界中的泛化能力,限制了深度模型在真实场景中的大规模部署和应用。报告立足于有限数据标注下的诸多场景,致力于提升模型在开放世界中的视觉泛化推理能力,主要内容包括模型如何利用对比学习挖掘训练与测试数据分布之间共享的“一致性”信息,以实现有效的知识迁移,以及如何构建通用的监督信号实现连续目标域的可持续泛化。

个人简介:杨旭,西安电子科技大学电子工程学院精英副教授,主要从事多模态内容理解、机器学习、计算机视觉等相关领域的研究,在相关领域发表论文30余篇,其中包括IEEE Trans.权威期刊(TPAMI、TNNLS和TIP等)和CCF-A顶级会议(CVPR、NeurIPS、和AAAI等)。主持国家自然科学基金项目,作为骨干成员参与国家自然科学基金重点基金,国家重点研发计划重点专项等项目多项。曾入选陕西省科协青年人才托举工程,获2024陕西省自然科学奖一等奖、2021年吴文俊人工智能科学技术奖优秀博士论文奖以及2021 ACM XI’AN 优博奖。担任TPAMI, TIP, TCYB, TNNLS, CVPR, AAAI, NeurIPS, ICML等期刊和会议审稿人和(高级)程序委员。


张志忠

华东师范大学副教授

报告题目:面向大规模点云语义分割的弱监督学习方法研究

报告摘要:3D视觉理解和分析是计算机感知物理世界的重要途径,随着激光雷达等远距离传感器的发展,三维点云,作为一种新兴的视觉数据,在自动驾驶、三维重建等领域具有重要应用。当前3D点云分割方法网络训练依赖于完全标记的数据集,其标注费时耗力成本高,无法满足弱标记自主学习的实际需求。汇报人的系列研究关注于点云的弱监督学习,利用自监督学习、视觉基础模型理论和方法,突破监督信息不足、模型泛化能力不足等局限,形成大规模点云预训练模型,构建点云主动标注工具集,将单帧标注时间下降10倍,为3D点云分割提供新的解决思路和关键技术支撑。

个人简介:张志忠,华东师范大学副教授,中国图象图形学学会数字娱乐与智能生成专委会,主要研究方向为机器学习以及计算机视觉,研究成果集中于多视图学习、自监督学习等。作为项目负责人,先后承担了国家自然科学基金青年项目、上海市人工智能重大专项,CAAI—Mindspore学术奖励基金,参与国家自然科学基金重大项目、国家“科技创新2030”重大项目等,在国内外权威期刊和顶级会议上共发表和接收学术论文40余篇,包括CVPR,ICCV,AAAI等。


论坛联系人

姓名:易冉

单位:上海交通大学

邮箱:ranyi@sjtu.edu.cn

空间信息感知与深空探测论坛

论坛简介

        随着越来越多国家拥有进入空间和利用空间的能力,具备更强大的空间信息感知能力已成为21世纪大国科技竞争的战略制高点。空间信息感知的关键在于构建新型空间信息感知系统,实现空间资产、空间环境、空间活动天地一体化协同感知。深空探测是指对月球及以远天体或空间环境开展的探测活动,深空探测任务面临探测环境复杂且不确定、信息融合和感知难等一系列关键难题,对图像图形技术提出了更高更迫切的需求。

       本论坛围绕大会图像图形智能化处理主题,聚焦空间信息智能感知与深空探测技术前沿,邀请国内知名专家学者进行专题讲座,研讨本领域需重点发展的关键技术,丰富和拓展中国图象图形大会的主题布局,为高水平科技自立自强贡献空间信息感知与决策专委会的力量。

论坛日程

论坛时间:2024年5月24日 18:30-21:30

论坛名称:空间信息感知与深空探测

主持人:姜晓军、谢更新

论坛主席

姜晓军

中国科学院国家天文台研究员

个人简介:姜晓军,中国科学院国家天文台光学观测技术研究团组首席研究员、博导、中国科学院大学岗位教授,国家天文台光学天文研究部总工程师,首批“中国科学院特聘研究员”计划特聘核心骨干。研究方向:天文技术与方法、态势感知技术。


谢更新

重庆大学教授

个人简介:谢更新,担任探月工程嫦娥四号生物科普载荷总设计师,教育部创新团队负责人,教育部科技委学部委员。重庆大学先进技术研究院院长,教授,博士生导师。先后担任探月工程“嫦娥三号”“嫦娥七号”独立评估专家、国家中长期深空探测论证组专家,国际宇航学会专委会成员,中国宇航学会理事,中国宇航学会深空探测专委会成员,军委装备发展部、国防科工局、军委科技委等专业组专家,中国航天强国战略纲要编写组专家等。获“教育部新世纪优秀人才支持计划”资助,中国产学研促进创新个人奖,国防科工局探月三期关键技术先进个人奖励,获人社部、国防科工局等六部委联合表彰“探月工程嫦娥四号任务突出贡献者”荣誉称号。先后主持国家项目10余项,获教育部自然奖一等奖1项,教育部技术发明奖一等奖1项,国家科技进步奖二等奖1项。发表论文60余篇,包括SCI、EI论文共36篇,其中第一作者8篇。获国家专利10余项,专著4部。


论坛讲者信息

朱枫

中国科学院沈阳自动化研究所研究员

报告题目:空间探测任务及其对视觉感知的需求

报告摘要:本报告给出了空间探测的主要任务、对视觉感知的需求、工程实现的限制与条件、相关技术的现状与发展趋势等。最后对中国科学院沈阳自动化研究所在空间视觉方面的主要研究内容与取得的成果进行简要介绍。

个人简介:朱枫,中国科学院沈阳自动化研究所研究员,博士生导师。主要研究方向包括机器人视觉、人工智能等。在视觉定位、图像处理、目标识别、智能感知等方面取得了一定的研究成果,发表论文百余篇。所取得的研究成果在空间领域与工业机器人领域获得了成功应用。多次获得国家与省部级科技奖项。


谢更新

重庆大学教授

报告题目:月球首次生物实验

报告摘要:2019年,由重庆大学牵头研制随我国探月工程嫦娥四号任务搭载了一个重2.608公斤,只有放水和拍照控制信号及包络尺寸只有Φ173 mm×198.3
mm、其中生物生长空间只有0.82L,最大功耗不超过15w的严格限制下,将一个由植物、动物、微生物共6种生物构成的微型生态系统,通过嫦娥四号搭载至月球背面,营造一个适合生物生存的环境在月球背面开展生物试验,通过对载荷内动、植物的一些重要生命活动的监测,如温度、气压、照片或视频,在月面首次向全人类展示一些重要的生命现象,如植物种子发芽、生长等;该实验被Nature、Science评价为“人类月球第一片绿叶”,攻克了生物静置、固定、防月尘、高湿度照相等关键技术,并向广大市民传播了光合作用、生态循环等生物学知识,以及对宇宙和空间环境的认识;激发人们对宇宙探索的热情,提高人们的环境保护意识,宣传我国探月工程成果,增强人民的民族自豪感,彰显我国在航天及其相关技术研究领域的巨大成就和国际领先地位。

个人简介:谢更新,担任探月工程嫦娥四号生物科普载荷总设计师,教育部创新团队负责人,教育部科技委学部委员。重庆大学先进技术研究院院长,教授,博士生导师。先后担任探月工程“嫦娥三号”“嫦娥七号”独立评估专家、国家中长期深空探测论证组专家,国际宇航学会专委会成员,中国宇航学会理事,中国宇航学会深空探测专委会成员,军委装备发展部、国防科工局、军委科技委等专业组专家,中国航天强国战略纲要编写组专家等。获“教育部新世纪优秀人才支持计划”资助,中国产学研促进创新个人奖,国防科工局探月三期关键技术先进个人奖励,获人社部、国防科工局等六部委联合表彰“探月工程嫦娥四号任务突出贡献者”荣誉称号。先后主持国家项目10余项,获教育部自然奖一等奖1项,教育部技术发明奖一等奖1项,国家科技进步奖二等奖1项。发表论文60余篇,包括SCI、EI论文共36篇,其中第一作者8篇。获国家专利10余项,专著4部。


肖志松

北京信息科技大学教授

报告题目:硅基微腔集成光学陀螺研究与进展

报告摘要:陀螺仪作为惯性导航的关键部件,决定了飞行器、运载机械和无人系统等导航定位的精度和姿态控制的稳定性。在兼顾精度的同时,小体积可集成的陀螺仪需求越来越迫切,微纳集成的光学陀螺有望同时满足小体积可集成与高精度等应用需求。报告结合国内外近年来微纳集成光学陀螺研究的新进展,论述了集成光学陀螺的研究现状、瓶颈问题和未来发展趋势。基于新材料、新结构和新物理效应等可能的解决途径,重点阐述了光增益补偿、色散调控、非厄米奇异点(面)等对硅基微腔集成光学陀螺敏感性能的影响与研究进展,并对微纳集成光学陀螺的未来发展趋势进行了展望。

个人简介:肖志松,主要研究方向为光电集成材料、器件与精密测量物理。近年来主持国家国际科技合作专项、国家科技支撑计划、国家自然科学基金等项目10余项;参与国家重点研发计划、国家重大重点项目和北京市科技专项等10余项。发表相关领域学术论文150余篇,授权中国发明专利15项。主要从事光电集成材料与器件技术研究工作,发现并制备了国际电联(ITU)光通讯窗口波长范围内连续带宽达230 nm硅基发光及光放大材料与器件,目前仍保持此通讯波段最宽记录;在光原子精密测量物理领域,提出了基于反常色散/压缩光场的谐振型快光陀螺结构,并制备芯片级高精度非厄米硅基光波导陀螺原型,消除了闭锁效应;开展了具有PT对称性和反PT对称的非厄米量子光学理论研究及其在精密测量物理中的应用。作为参与完成人北京市科技进步三等奖、国防科技进步二等奖、教育部科技进步一等奖和国家科技进步二等奖各一项。


尹继豪

北京航空航天大学教授

报告题目:内嵌数理知识的小行星自主抵近探测智能理论

报告摘要:人工智能与科学深度结合是空间科学与工程应用领域实现AI赋能与新范式构建的重要核心手段。当前我国正在加速推进深空开发进程,即将实施首次小行星采样等任务,然而受极端复杂深空环境、有限器载计算资源、较大地面操控时延等因素影响,现有的先规划后实施的探测模式存在交互时效性低、自主应变性弱、环境适应性差等问题。

本报告阐述人工智能理论与深空领域数据知识、物理特性规律融合赋能的核心机理,建立内嵌天体力学和行星科学知识的天地一体化自主抵近探测新范式;研究物理特性智能综合反演理论、数理知识引导的具身智能探测模式、天地协同的智能体自主演进方法,建立低质量/稀疏观测数据下精细物理特性的高效智能综合反演与泛化能力,实现复杂深空环境下在线主动感知和自主规划决策,提升探测适应性、自主性、处变性及效率。

个人简介:尹继豪,北京航空航天大学教授、博导。研究方向:面向深空探测的AI理论与应用、光学遥感图像智能处理。担任中国图象图形学学会“空间信息感知与决策”专委会常务副主任,担任JKW领域专家、装备发展专业组专家等,科技创新2030-“新一代人工智能”重大项目首席科学家。入选国家留学基金委“未来科学家”计划,2015-2017年在美国麻省理工学院电子工程与计算机科学系从事智能领域科学研究。主持科技部重大项目、国家自然科学基金、创新特区项目、“十二五”863项目、航天院所基金及横向项目30余项;在Science Advances, Advanced Materials, Pattern Recognition,IEEE Transactions on Geoscience and Remote Sensing等顶级学术期刊上发表学术论文80余篇;获授权发明专利20余项。成果应用于“玉兔2号”月面图像典型目标识别、新技术高光谱卫星、火箭遥测图像定量测量系统等。


魏凯

浙江大学教授

报告题目:激光合成孔径雷达技术进展

报告摘要:激光合成孔径雷达(SAL)是一种成像分辨力与目标距离无关的相干成像技术,在远距离光电识别领域具有广阔的应用前景。报告将系统的梳理该技术的国内外发展现状,凝练总结该技术远距离工程应用过程中面临的科学问题和技术难题,并将从激光波形调制与编码、激光振幅与相位补偿,以及数字解码等多个方面介绍团队的最新研究成果,汇报团队在地基1.8米望远镜上集成的地基远距离逆合成孔径成像系统,以及该系统使用自适应光学湍流校正和高精度相位误差补偿方法,实现的远距离激光合成高分辨率成像结果。

个人简介:魏凯,浙江大学求是特聘教授,博士生导师,入选国家高层次人才计划,国家先进光学方向专家组组长,省部级交叉创新团队带头人,浙江省光电自主感知重点实验室主任,美国加州理工学院高级访问学者,美国凯克10米望远镜激光发射系统负责人、国际30米望远镜激光导星系统负责人。魏凯教授课题组长期致力于光电探测与识别技术研究,在无人系统自主感知、激光雷达探测、片上集成光电子器件等相关细分研究方向上,具备从产品应用到原型系统集成、关键技术攻关、核心器件研制、基础理论与工艺探索的全链路协同创新能力。魏凯教授先后荣获国家技术发明一等奖、二等奖各1项,授权发明专利60余项,发表SCI论文70余篇。

张仰飞

宁波维真显示科技股份有限公司联合创始人

报告题目:微晶光场元3D沉浸式系统

报告摘要:人类有3个永恒追求,看得清、看得远、看得真,其中前两个已经实现,看得真还未实现,现在市面上所有VR和元宇宙产品就是为了实现看得真,但是它们都有个共同的问题,就是设备需要充电维护,并都十分笨重,所以无法长期使用,微晶3D系统是目前所有VR/元宇宙显示产品中最轻薄舒适并且无须电力支持的终端产品,全球第二,国内唯一,真正解决了“卡脖子”的难题,真正做到了不再受制于人。美国的元宇宙是基于充电眼镜式3D做入口,把微透镜靠近人眼,微晶3D元宇宙是裸眼3D+无源眼镜式3D,把微透镜靠近屏幕,哪一种更容易大规模商业化落地,很快就能见分晓,维真已经做好了所有的技术储备。

微晶3D技术可以实现复杂产品的虚拟仿真和模拟,将极大地方便工程师开展工作。例如发动机设计,传统的计算机辅助三维模型与裸视三维图形显示技术结合,更能完整地呈现各种机械结构的空间立体关系。并已成功应用于载人航天飞控指挥大厅,成功承担了天和核心舱发射保障任务,这是3D显示技术在航天领域的首次应用。

个人简介:张仰飞,中国社科院MBA,先后任职于韩国三星和LG集团。在担任三星大中华区战略客户Team高级总监期间,带领团队创造单项目业绩金额超3亿人民币,荣获三星集团总裁奖。


论坛联系人

姓名:崔林艳

单位:北京航空航天大学 副教授

邮箱:cuily@buaa.edu.cn

基于学习的感知理解论坛

论坛简介

        智能与感知密不可分,对于我们人类来说没有视觉等感知就没智能,对于智能系统来说也是一样。同时,学习是智能的基石,理解则是智能的体现。论坛将深入剖析学习算法与感知理解技术的融合应用,分享最新研究成果,挖掘未来发展方向。此外,我们还将创建跨领域的交流机会,促进不同领域间的思想碰撞与合作创新。此论文邀请了多位从事前沿研究的重要专家进行演讲分享,无论您是人工智能领域的专家学者,还是对智能科技感兴趣的爱好者,都不容错过这场重要活动。让我们共同见证新的学习力量,探索感知理解的无限可能,为智能系统的发展贡献智慧与力量!

论坛日程

论坛时间:2024年5月24日18:30-21:30

论坛名称:基于学习的感知理解

主持人:陈胜勇、韩军伟

 

论坛主席

陈胜勇

CSIG理事,天津理工大学教授

个人简介:陈胜勇,国家杰出青年科学基金获得者(2013),IET Fellow,英国特许工程师及认证官,天津市特色学科群“新一代人工智能与系统”负责人、天津理工大学副校长。2003香港城市大学取得博士学位、2004西班牙萨拉戈萨大学博士后研究员、2007德国汉堡大学洪堡学者、2009英国帝国理工学院访问教授、2012英国剑桥大学访问教授。主要从事计算机视觉与模式识别领域的研究,先后主持国家级项目8项,在国际期刊上发表200多篇论文,在Springer、科学出版社等编著10多部英文学术著作、5部中文著作,发明专利100多项。被他引15000多次,多次入选高被引科学家,获得省部级科技一等奖3项。担任3种国际学术期刊的主编和副编,作为主席和专题主席组织10多次国际学术会议。


韩军伟

西北工业大学教授

个人简介:韩军伟,国家教育部特聘教授,国家科技创新领军人才,全球“高被引科学家”。主要研究人工智能、模式识别、类脑计算、遥感影像解译等。在领域顶级期刊/会议如:Proc. IEEE,IEEE TPAMI,CVPR,MICCAI等发表学术论文150余篇,论文被引用3万余次,H-index 90。3篇论文入选年度中国百篇最具影响国际学术论文。培养多名博士生/博士后获得中国图象图形学学会优秀博士论文奖、陕西省优秀博士论文奖、博士后创新人才支持计划、国家级青年人才计划、高被引科学家等。获陕西省科学技术一等奖等8项省部级科技奖。担任IEEE TPAMI、IEEE TMM、《中国科学:信息科学》等多个国内外期刊编委,任国际会议CVPR等的领域主席。


论坛讲者信息

刘洪海

哈尔滨工业大学(深圳)教授

报告题目:眼神信息计算及孤独症早期筛查与干预

报告摘要:报告人首先汇报视线,眼接触等眼神信息计算的现状与进展,然后介绍其团队近年在眼神计算模型及多模态融合与交互策略,并汇报其在孤独症早期筛查与干预的应用,最后讨论了眼神信息计算与应用的挑战与展望。

个人简介:刘洪海,欧洲科学院院士,国家特聘教授。英国伦敦大学国王学院智能机器人博士学位。主要从事人体运动行为感知技术,生机电一体化及智能机器人理论与应用等方面的研究,在广义机器人系统运动学及“运动/认知”集成模型,人体运动信息检测、处理与生机电一体化系统技术等智能计算和智能机器人领域有较大国际影响,并已在脑卒中康复、自闭症早期筛查与干预、欧盟猎兔犬火星计划、海洋引擎的故障诊断等领域得到成功应用,取得了一系列具有国际影响的创新成果。


姚鸿勋

CSIG常务理事,哈尔滨工业大学教授

报告题目:面向弱标注数据的视觉感知

报告摘要:深度神经网络的成功源于在大规模高质量标记数据集上的训练,但对于更复杂的视觉数据如多模态、视频以及医学图像等,往往需要昂贵的标注或需要专家知识的判断,这种复杂的标注限制了数据集的大小阻碍了模型的训练。基于弱标注数据的视觉感知学习可以克服模型训练对于良好标注数据的依赖,还可以为模型提供更好的解释性和鲁棒性,为应对现实世界中数据标注成本高昂的挑战提供了新的解决方案。本报告将简要介绍视觉感知在面向噪声数据的主要挑战;基于表征学习的解决方法;基于噪声引导与强化学习的特征传播解决方法;总结并展望弱标注数据领域当前研究热点。

个人简介:姚鸿勋,哈尔滨工业大学长聘教授,博士生导师,黑龙江省政府特殊津贴专家,教育部”新世纪优秀人才”,校优秀博士生导师,中国图象图形学学会优秀博士论文指导教师, 中国计算机专业优秀教师,中国图象图形学学会第七、第八届常务理事,现任中国图象图形学学会情感计算与理解专业委员会主任。已发表ICCV, CVPR, ACM MM等顶级国际会议及IJCV, TPAMI, TIP, TMM等高影响因子国际期刊文章学术论文300余篇,多篇高被引文章,H指数>50,Google引用量10000+,入全球人工智能TOP 2000榜单学者榜单,中国人工智能100位榜单人物。先后主持国家自然科学基金重点、国家自然基金、国家“2030新一代人工智能”重大专项课题以及国际合作项目等二十余项,获国家及省部级自然科学奖项4项等。


白翔

CSIG理事,华中科技大学教授

报告题目:基于多模态大模型的图像细节描述能力提升方法

报告摘要:多模态大模型(LLMs)在视觉语言任务方面表现出了令人印象深刻的能力。然而,由于支持输入分辨率的限制以及训练图像文本对的不详尽描述,这些模型在处理复杂的场景理解和叙述时常常遇到挑战。为了解决这些问题,我们提出了“Monkey”。Monkey通过将输入图像划分小块,并为每个小块配备独立的适配器来捕捉每个图像区域的细节特征。其次,Monkey采用多层次描述生成方法,能够为任意一张图片生成详细描述,丰富了场景与对象的关联。在各种数据集上进行测试的结果表明,Monkey在图像描述生成、场景问答、以场景文本为中心的视觉问答和面向文档的视觉问答等任务中表现出色。特别是,在以密集文本问答为主的定性评估中,与GPT4V相比,Monkey展现出了亮眼的结果。

个人简介:白翔,国家杰青获得者,华中科技大学软件学院院长,机器视觉与智能系统湖北省工程研究中心主任。主要研究方向计算机视觉与模式识别、文档分析等。已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、CVPR等发表论文80余篇。由于在场景文字检测与识别取得的显著成绩,2019年在国际模式识别协会主办的国际文档分析与识别会议上获得IAPR/ICDAR
Young Investigator Award (青年学者奖)。现任期刊IEEE TPAMI、中国图象图形学学报等期刊编委。曾担任CVPR、AAAI、IJCAI、ICPR等人工智能主流国际会议的领域主席/资深技术程序委员或竞赛主席十余次,并获得AAAI-2019 Outstanding SPC Award。连续7年入选Elsevier中国高被引学者榜,入选IAPR Fellow。


郑钰辉

南京信息工程大学教授

报告题目:基于深度时空记忆的视频目标分割

报告摘要:视频目标分割作为视频数据智能化处理的关键技术之一,一直是计算机视觉任务中的研究热点,为底层目标提取和高层行为分析搭建桥梁,填补底层视觉与高层场景理解之间的语义鸿沟。该报告以当前视频目标分割方法所面临的关键技术难点为出发点,围绕视频场景中目标数据复杂和运动复杂两大难题,以模拟人类感知物体过程为主旨,通过重点研究深度时空记忆网络,以及挖掘视频中底层视觉和高层语义交叉关联的时空信息,充分利用网络中前景目标的先验知识,对分割目标表征记忆和目标运动记忆进行迭代融合与萃取,并持续学习与更新记忆网络中目标信息,最终构建面向长时、复杂、真实场景的模型框架,实现具有高精度、低成本、高效率的视频目标分割算法。

个人简介:郑钰辉,国家级高层次青年人才,江苏省杰出青年基金获得者。现为中国认知科学学会认知与类脑计算专委会委员、中国图象图形学学会青工委委员、江苏省军工学会副主任、JSAI智能感知技术与应用专委会副主任兼秘书长。国家自然科学基金重点项目、国合交流项目负责人。已一作/通信作者发表IEEE-TIP、AAAI、ACM-MM等CCFA类推荐期刊论文与会议百余篇。曾获2022年度江苏省科学技术奖二等奖。


韩军伟

西北工业大学教授

报告题目:无人系统视觉感知

报告摘要:无人系统视觉感知是空天地海一体化观测系统的一项关键技术。与自然图像相比,无人系统对地观测的图像具有目标方向多变、目标类型及数量繁杂、特定领域样本稀缺、成像视角单一等特点,此外,不同平台、不同光照、天气条件、大气参数等都会对图像获取产生影响。这些综合因素使得无人系统视觉感知任务,与自然图像理解相比,面临着更大的挑战和更多的难点问题。当AI与无人系统视觉感知深度融合,将会产生怎样的火花?本报告首先总结分析了无人系统中目标检测与识别任务面临的挑战,接下来重点汇报我们团队在旋转不变目标检测、有向目标检测、弱监督目标检测、小样本目标检测、以及目标型号识别等方向取得的研究进展和典型应用,最后展望了未来的研究工作。

个人简介:韩军伟,国家教育部特聘教授,国家科技创新领军人才,全球“高被引科学家”。主要研究人工智能、模式识别、类脑计算、遥感影像解译等。在领域顶级期刊/会议如:Proc. IEEE,IEEE TPAMI,CVPR,MICCAI等发表学术论文150余篇,论文被引用3万余次,H-index 90。3篇论文入选年度中国百篇最具影响国际学术论文。培养多名博士生/博士后获得中国图象图形学学会优秀博士论文奖、陕西省优秀博士论文奖、博士后创新人才支持计划、国家级青年人才计划、高被引科学家等。获陕西省科学技术一等奖等8项省部级科技奖。担任IEEE TPAMI、IEEE TMM、《中国科学:信息科学》等多个国内外期刊编委,任国际会议CVPR等的领域主席。


论坛联系人

姓名:薛万利

单位:天津理工大学 教授

邮箱:csy@tjut.edu.cn, xuewanli@email.tjut.edu.cn

连续学习的理论和应用论坛

论坛介绍

        近年来,基于深度学习的方法在数据分布固定的假设下,在各类下游任务上取得了令人满意的性能。然而,现实世界的数据通常是分布不稳定的流式数据,使得模型很难在获取新知识的同时保留旧知识,这一现象被称为灾难性遗忘。为解决灾难性遗忘的问题,连续学习被提出,为了在流式训练数据下,模型能够不断学习新的输入知识,同时也避免旧知识的灾难性遗忘。

论坛日程

论坛时间:2024年5月24日 14:00-17:20

论坛名称:连续学习的理论和应用

主持人:赵 耀、左旺孟

论坛主席

 耀

CSIG常务理事、会士,北京交通大学教授

个人简介:赵耀,教育部重要人才工程入选者,国家杰出青年基金获得者,万人计划科技创新领军人才,第八届”信息与通信工程学科”国务院学科评议组成员,科技北京百名领军人才,IEEE Fellow。现为北京交通大学信息所所长,“现代信息科学与网络技术”北京市重点实验室主任,“信号与信息处理”国家级重点学科责任教授。承担和完成科技创新2030——新一代人工智能项目、重点研发计划课题、973课题、863、国家自然基金重大国际合作项目等37项国家级项目。作为第一完成人获北京市科学技术奖一等奖、高等学校自然科学奖一等奖、中国图象图形学学会科学技术奖一等奖等省部级奖励5项。获全国高等学校优秀骨干教师、北京市五四奖章、国家百千万人才工程入选者等荣誉称号。

左旺孟 

哈尔滨工业大学教授

个人简介:左旺孟,博士生导师。长期关注元学习、迁移学习和生成式对抗网络模型方法及其在底层视觉、图像生成、视觉跟踪、物体检测和图像分类等领域的应用。在CVPR/ICCV/ECCV等顶级会议和T-PAMI/IJCV和IEEE Trans.等顶级期刊上发表论文100余篇。担任国际人工智能顶级期刊IEEE TPAMI、TIP等国际期刊编委。提出的DnCNN模型被正式收入MATLAB 2017b及后续版本的Image Processing和Deep Learning Toolbox,并被CV-News Magazine作为Main Story专题报道。担任人工智能学会模式识别专委会常委、中国图象图形学学会机器视觉专委会常委、中国图象图形学学会青工委执委。多次受邀担任ICCV、CVPR等CCF-A类领域主席及IJCAI、AAAI等CCF-A类会议高级程序委员。

论坛讲者信息

陈熙霖

CSIG常务理事,中国科学院计算技术研究所研究员

报告题目:两仪生四象,四象生八卦——关于层次化与组合性

报告摘要:在自然科学领域,广泛地存在着一些基本单元,不论是化学中的元素、物理中的基本物理规律还是几何中的基本形状。这些基本元素的组合构成了丰富的世界。同样在感知和认知的过程,这种组合性也广泛地存在着。探索这种组合性对开放世界的认知具有重要的作用。报告将介绍我们近期在这方面的尝试与进展,探索从层次化与组合性视角处理开放世界的识别问题。

个人简介:陈熙霖,ACM Fellow, IEEE Fellow, IAPR Fellow, 中国计算机学会会士,国家杰出青年基金获得者。主要研究领域为计算机视觉、模式识别、多媒体技术以及多模式人机接口。先后主持多项自然科学基金重大、重点项目、973计划课题等项目的研究。曾任IEEE Trans. on Image Processing和IEEE Trans. on Multimedia的副主编,目前是Journal of Visual Communication and Image Representation的副主编、计算机学报副主编、人工智能与模式识别副主编,担任过FG2013 / FG 2018 General Chair以及CVPR 2017 / 2019 / 2020, ICCV2019等的Area Chair。先后获得国家自然科学二等奖1项,国家科技进步二等奖4项,省部级科技进步奖九项。合作出版专著1本,在国内外重要刊物和会议上发表论文200多篇。

刘青山 

CSIG理事,南京邮电大学教授

报告题目:面向多元异构数据的持续学习

报告摘要: 持续学习目的是把已学习知识迁移到当前任务时应该保证新模型满足“稳定性-可塑性”准则,也就是如何学习动态变化的新环境知识的同时,避免遗忘已学习的旧知识。针对真实动态场景下数据稀缺、模态多样和内容动态的问题和挑战,本报告将围绕面向多元异构数据的持续学习展开介绍,分别从基于视觉语言模型的“稳定性-可塑性”学习、文本知识引导的持续学习和视听觉数据融合的持续学习三个方面进行汇报。最后将探讨多模态大模型时代下持续学习面临的挑战。

个人简介:刘青山,江苏省特聘教授,教育部新世纪人才计划,江苏省自然基金委首批杰出青年基金资助,江苏省双创个人计划,江苏省创新团队领军人才,江苏省优秀教育工作者称号,教育部自然科学二等奖。现任职南京信息工程大学自动化学院院长,曾任美国Rutgers大学研究助理教授,中国科学院自动化研究所模式识别国家重点实验室工作任副研究员,香港中文大学访问学者。担任国际杂志NeuroComputing、Signal Processing和国内杂志《自动化学报》编委,是国际杂志IEEE Transaction on Multimedia、Pattern Recognition Letters、Computer Vision and Image Understanding客座编委。2003年获中国科学院院长优秀奖。IEEE Senior Member。中国Vision And Learning SEminar (VALSE) 青年论坛的发起人和组织人。

李宏亮

电子科技大学教授

报告题目:视觉任务连续学习的问题和思考

报告摘要: 如何解决模型在低遗忘旧知识的同时不断地学习新知识是目前连续学习面临的重要挑战。本次报告将围绕视觉任务中的连续学习问题,介绍本课题组最近的相关工作,包括模型的低损失路径优化、任务偏见,以及多教师连续学习模型的实现等。最后针对连续学习的若干问题进行简要讨论。

个人简介:李宏亮,博士生导师,2015国家杰出青年基金获得者,四川省学术和技术带头人。2005-2008在香港中文大学视觉信号处理与通信实验室先后作为Research Associate和 Postdoctoral Fellow,从事研究工作。2008 年作为教授引进到电子科技大学,是图像和视频处理方向的团队负责人。李宏亮教授先后在国内外一些重要的期刊和会议上发表多篇论文。主持了国家自然科学杰出青年基金,重点基金,教育部新世纪人才计划,博士点基金等多个省部级以上科研项目。李宏亮教授目前的主要研究兴趣包括:人工智能多媒体分析,机器学习,计算机视觉。

郑伟诗

CSIG理事,中山大学教授

报告题目:微记忆下的连续图像识别

报告摘要:一直以来,我们希望深度学习模型能不断地针对新问题、新类别、新数据等展开持续性学习。然而,由于灾难性遗忘问题的存在,当深度学习模型针对新任务做优化后,原有任务的分类等性能产生严重的下降。为此,近年以来,不少新颖的连续学习算法被提出。在连续学习上,我们做了些初步工作,主要是如何利用无标注数据解决小记忆下的连续学习建模问题和如何利用提示建模解决零记忆环境下快速适配下游任务的连续学习问题。我们将对这些近期的探索做介绍,并期望与大家一起讨论。

个人简介:郑伟诗, 机器智能与先进计算教育部重点实验室主任,大数据分析与应用技术国家工程实验室副主任。教育部“长江学者奖励计划”特聘教授,国家优青,广东省自然科学基金委卓越青年团队负责人,广东省科技创新领军人才。担任国际人工智能顶级期刊IEEE TPAMI等国际期刊编委,国际顶级学术会议CVPR、ICCV、NeurIPS的领域主席,国际多媒体重要学术会议ICME 2022程序委员会联合主席,中国模式识别与计算机视觉大会2023程序委员会联合主席等。曾多年入选中国高被引学者(爱思唯尔)和全球前2%顶尖科学家榜单。发表 CCF-A/中国科学院1区/Nature子刊150多篇,其中在IEEE T-PAMI/IJCV/Siggraph/自然通讯20余篇;作为负责人,主持国家自然科学基金委联合基金重点项目、国家自然科学基金优秀青年科学基金、国家重点研发课题等。

魏云超

北京交通大学教授

报告题目:面向视觉感知的连续学习方法

报告摘要:连续学习下的视觉内容感知研究聚焦于如何使模型不断适应新环境、识别新类别最终达成模型自身认知能力的提升。在本次报告中,魏云超教授将围绕如何在基于预训练模型开展连续学习?如何在解决精细化视觉感知任务中背景漂移问题?在多模态大模型时代开展连续学习的必要性?如何将连续学习赋能具身智能?等问题展开讨论并介绍其团队在执行科技创新2030-新一代人工智能重大项目“连续学习的理论和方法”过程中产生的相关研究成果。

个人简介:魏云超,国家高层次人才项目获得者,博士生导师。2019年入选澳大利亚研究委员会青年研究奖,加入悉尼科技大学获终身助理教授职位,并于2021年破格提升为高级讲师。入选百度2022年AI全球华人青年学者榜单、《麻省理工科技评论》2021年中国区“35岁以下科技创新35人” (MIT TR35 China)、《澳大利亚人》2020年全澳Top 40青年学术研究者(计算机领域共5人)。曾获教育部高等学校自然科学奖一等奖、中国图象图形学学会科技技术奖一等奖 、澳大利亚研究委员会青年研究奖ARC DECRA、IBM C3SR最佳研究奖、计算机视觉领域世界杯ImageNet竞赛冠军、CVPR 人体精细化分割冠军、Youtube-VOS大规模视频物体分割冠军等。在国际顶级会议CVPR/ICCV/ECCV上多次组办相关的学术研讨会。发表IEEE TPAMI,IJCV,CVPR,ICCV,ECCV,NeurIPS等国际顶级期刊会议论文近百篇。

图像视频智能获取与复原前沿进展论坛

论坛简介

         图像和视频获取面临着来自多方面的挑战,包括但不限于设备、环境以及场景内容,在这一背景下,如何获取高质量的图像视频,以及如何提升其画质,成为学术界和工业界共同关心的热点问题。本论坛将聚焦于图像视频智能获取与复原领域的前沿进展,旨在推动思想的碰撞和经验的分享。与会者将集中讨论智能时代的典型案例,深入剖析这些方法的优势与局限性,以促进前沿技术在实际场景中的落地应用。通过学术研讨与交流,我们期望能够为图像视频智能获取与复原领域的问题寻找更为创新和实用的解决方案,推动领域的技术发展和应用推广。

论坛日程

论坛时间:2024年5月25日14:00-17:20(15:30-15:50茶歇)

论坛名称:图像视频智能获取与复原前沿进展论坛

主持人:黄华、王立志

论坛主席

黄华

CSIG常务理事,北京师范大学教授

个人简介:黄华,北京师范大学教授,人工智能学院执行院长,分别于1996年、2001年和2006年在西安交通大学电信学院获得工学学士、硕士和博士学位。西安交通大学和北京理工大学兼职教授。任中国图象图形学学会常务理事、多媒体专业委员会主任,中国计算机学会常务理事、学术工作委员会副主任,中国自动化学会理事、副秘书长。承担国家杰青、重点研发计划等项目。


王立志

北京理工大学准聘教授

个人简介:王立志,北京理工大学准聘教授,博士生导师,主要研究方向为计算摄像与图像处理,发表论文40余篇,荣获ACM MM 2022最佳论文提名,中国电子学会2018年度优秀博士学位论文奖,IEEE VCIP 2016最佳论文奖,承担国家优青、装备预研等项目,担任IEEE TIP编委。


论坛讲者信息

董超

中国科学院深圳先进技术研究院研究员

报告题目:大模型时代的底层视觉前沿探索

报告摘要:大模型正在改变整个人工智能的研究生态,它在底层视觉领域同样可以创造出前所未有的技术突破。借助文生图大模型,我们尝试将图像复原的性能推向极致,利用大规模高清数据,开发了图像复原大模型SUPIR,它可以生成4k级别的高清图像,还能根据文本指令控制细节生成。借助语言大模型,我们让图像质量评价从数值指标变成了语言描述,开发了多模态大模型DepictQA,它不仅可以分辨图像的各种退化类型,还能从多个方面分析两个图像的优劣,并给出最终的判断,这也将成为图像质量评价的新范式。

个人简介:董超,博士生导师,中国科学院深圳先进技术研究院研究员,上海人工智能实验室领军科学家,上海交通大学兼职博导。主要研究方向为底层计算机视觉,包括图像超分辨率、去噪和增强等,发表相关论文80余篇,谷歌引用量超过3万次。博士毕业于香港中文大学信息工程专业。2014年,在欧洲计算机视觉大会(ECCV)上发表论文SRCNN,首次将深度学习引入图像超分辨领域。2017年至今,多次带队参加国际图像超分辨率比赛,共获得9项冠军。2016年-2018年就职于商汤科技,带领商汤超分团队开发了世界首款基于深度学习的数码变焦软件。2021年被斯坦福大学评选为世界前2%顶尖科学家。2022年被清华大学评为AI 2000人工智能全球最具影响力学者。


孟德宇

西安交通大学教授

报告题目:无限维理解下的深度学习理论与算法

报告摘要:现有深度学习方法大多通过有限维的方式来对数据表示、网络架构等基本元素进行设计,然而,这些元素真正的内在表达却应为无限维。采用简化的有限维设计往往忽略算法各元素的本质无限维内涵,从而带来算法理论探索及应用扩展的局限。针对这一问题,本报告将尝试针对图像无限维表达、卷积核无限维表达、梯度场无限维表达等问题展开讨论,分别介绍研究团队在参数化卷积核,无限维神经表达,深度网络的类量子不确定性原理等深度学习基础理论与算法方面所作出的初步探索成果,并介绍基于其所延伸出一些典型示例应用。

个人简介:孟德宇,西安交通大学教授,博导,任大数据算法与分析技术国家工程实验室统计与大数据中心副主任。发表论文百余篇,谷歌学术引用超过26000次。现任TPAMI,NSR等7个国内外期刊编委。目前主要聚焦于机器学习基础理论与算法方面的研究。


董伟生

西安电子科技大学教授

报告题目:低质图像恢复与识别

报告摘要:针对图像恢复这一病态逆问题,构建基于最大后验概率估计的图像恢复模型,利用深度神经网络强大的学习能力,学习深度先验和改进的似然项,提升图像恢复性能。针对人脸及暗光图像增强,提出基于生成式先验的图像恢复方法。针对深度模型预测的不确定性,提出了基于不确定性驱动的损失函数,提升了算法的鲁棒性和性能。最后,针对低质量图像识别问题,提出了基于不确定性学习的特征自蒸馏和质量鲁棒的特征表征学习方法,提升了低质图像识别精度。

个人简介:董伟生,西安电子科技大学人工智能学院教授、副院长,教育部“长江学者”特聘教授。主要从事图像视频处理、深度学习、计算机视觉等方面的研究工作。主持包括部委重大项目、国家自然科学基金重大项目课题等项目,曾入选国家“优青”、万人计划“青年拔尖人才”、教育部“青年长江”等人才计划。在国际权威期刊和会议上发表论文100余篇,论文已被Google引用11000余次。曾任中国计算机学会推荐A类期刊IEEE Trans. on IP编委、CVPR 2022领域主席,现任SIAM Journal on Imaging Sciences编委。曾获国家自然科学奖二等奖1项(排名第二),陕西省自然科学一等奖2项、中国电子学会技术发明一等奖1项。


顾舒航

电子科技大学教授

报告题目:底层视觉前沿技术应用实践:AI-ISP

报告摘要:近年来,基于深度学习的图像复原与增强技术取得了突破性的进展,促进了其在产业界的广泛应用。图像信号处理器(ISP)是成像设备的重要组成部分,需要实时解决光学系统局限性、电子器件局限性以及视觉感知非线性带来的多方面挑战,对于图像增强方法的鲁棒性、灵活性以及高效性具有很高的要求。本报告结合报告人近年来在“基于人工智能的图像信号处理器”(AI-ISP)方面的工程实践,介绍如何通过设计专用硬件架构、高效增强网络结构、多源数据协同训练、弱监督训练、网络结构优化等技术,实现终端平台的鲁棒、灵活、高效图像增强。

个人简介:顾舒航,电子科技大学教授,国家级青年人才。博士毕业于香港理工大学,后加入苏黎世联邦理工学院任博士后研究员。长期从事人工智能与计算机视觉方面的研究,主要围绕图像复原与增强、图像压缩、图像生成等底层视觉问题展开研究。发表中科院一区期刊/CCF-A类会议论文40余篇,包括IEEETPAMI, IJCV, CVPR, ICCV, NeurIPS等。谷歌学术12000余次,获得北京市自然科学一等奖(第三完成人),入选斯坦福大学全球顶尖科学家榜单。曾参与/主导多个底层视觉相关的产业界项目,2020-2022年主管OPPO芯片子公司哲库多媒体AI算法部门,作为核心人员参与6纳米制程的影像外挂芯片与4纳米制程的手机系统级芯片项目。


薛天帆

香港中文大学教授

报告题目:AI和智能传感器是如何突破成像系统极限的

报告摘要:成像系统广泛应用于我们的日常生活中,从随手可得的手机摄像头到基于视觉的自动驾驶车辆。随着神经网络和计算摄影技术的快速发展,现代摄像系统捕捉到的图像质量有了显著的提升。然而,大多数成像系统仍然是基于典型的成像系统设计,包括镜头系统、RGB传感器和图像处理算法。这次演讲,我们将讨论新型镜头和传感器设计如何能够突破现有成像系统的限制。具体而言,我们讲讨论事件摄像机,无镜头成像系统,以及端到端成像系统设计,如何和AI图像处理算法结合,突破传统成像系统的极限。

个人简介:薛天帆教授是中文大学讯息工程系校长助理教授。在此之前,他在谷歌研究院担任主任工程师超过五年。他获得了麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士学位,师从William T.Freeman。2011年,他获得了中文大学的哲学硕士学位;2009年,他从清华大学获得了学士学位。他的研究重点是计算摄影、计算机视觉与图形学,以及机器学习。他的研究在学术界和工业界都引起了显著关注。他研究的反射光技术被谷歌Photoscan应用,该应用拥有超过1000万用户。他研究的快速双边学习技术已被集成到谷歌Tensor芯片中。他开发的夜景算法赢得了DPReview的最佳创新奖。他还担任多个顶级会议和期刊的审稿人,并担任CVPR 2020的网络主席,以及WACV 2023,ACM MM 2024,CVPR 2023和2024的领域主席(Area Chair)。


杨智尧

OPPO高级多媒体系统工程师

报告题目:AI手机的视频与图像应用

报告摘要:本次报告将重点介绍在OPPO AI手机中,视频超分与视效增强技术,视频智能花屏异常检测技术,以及图像AIGC消除技术的应用;结合手机工程化开发过程中对稳定性、流畅性、续航能力、以及画质体验的要求,阐明AI为视频图像的智能化应用带来的机遇与挑战;根据具体手机功能需求,形成专属的手机视频图像数据集,支撑AI算法专项训练,打通端侧系统框架,充分调度硬件平台有限的AI算力、画质与能耗自动化评估体系,形成一条服务于AI手机的高效视频图像技术开发流程;最后参考当前大模型发展情况,给出未来视频图像在AI手机上的应用展望。

个人简介:杨智尧,OPPO高级多媒体系统工程师,吉林大学电路与系统工学博士,负责OPPO视频编解码基础能力优化,视效算法与功能开发,主导OPPO超分与视效增强功能的端侧应用,以及HDR视频技术应用开发,深耕于视频图像编解码及视频图像前后处理领域,现后参与视频智能降噪与图像Inpainting,视频智能异常检测,视频/游戏画质自动化智能评价,以及多视角视频应用等技术项目研发,作为OPPO视频图像领域产学研负责人,与浙江大学、中国科学技术大学、上海交通大学、武汉大学等相关领域院校保持长期良好的合作关系。


论坛联系人

姓名:王立志

单位:北京理工大学

邮箱:wanglizhi@bit.edu.cn

医学影像智能分析论坛

论坛简介

        “医学影像智能分析”论坛是一个专注于探索医学影像与人工智能融合交汇技术的交流平台。随着医学影像技术和大模型的发展,已涌现出多模数据融合、医学影像生成、医学影像大模型等新技术,并在疾病检测诊断、疗效评价中创新应用,推动着该领域向基础医学和临床服务发展。论坛响应国家对“人工智能+医疗健康”的积极推动,以及“健康中国2030”的战略部署,在“人工智能+”、智能医学、医学大模型的背景下,围绕“精确诊断、智能分析、创新应用”的主题,结合医疗大模型的进展及应用,邀请有影响力的领域嘉宾进行深入的演讲和交流,共同探讨医学影像智能分析的最新进展、挑战和机遇,以激发新的思想和创新,促进领域内交流与合作,推动我国医学影像智能分析领域的快速发展。

论坛日程

论坛时间:2024年5月25日 14:00-17:20

论坛名称:医学影像智能分析

主持人:卢虹冰、夏 勇

论坛主席

卢虹冰

CSIG理事,空军军医大学教授

个人简介:卢虹冰 ,空军军医大学教授,博导,主要从事医学成像与智能诊疗领域研究,主持国家重点研发专项、国家自然科学基金重点、军队后勤科研重点等项目等30余项,在领域权威期刊IEEE Tran Med Imag,Biomaterials等发表SCI论文100余篇,最高影响因子22.3,授权国家发明专利12项;获陕西省科学技术一等奖、中国体视学会技术发明二等奖、军队科技进步奖等奖励。现任中国生物医学工程学会理事、中国图象图形学学会理事、陕西省生物医学工程学会理事长、军队卫生装备学专委会秘书长等职,IEEE Trans Med Imag、Medical & Biological Engineering & Computing、Frontiers in Neuroscience等期刊编委 (AE),国家重点研发计划项目首席专家。


夏勇

西北工业大学教授

个人简介:夏勇,西北工业大学长聘教授、博导,空天地海一体化大数据应用技术国家工程实验室成员,主要从事医学影像智能计算领域研究,近5年在本领域顶级期刊和会议JAMA Network Open、Radiology、IEEE TPAMI/TMI/TIP/JBHI、MedIA、NeurIPS、CVPR、MICCAI、AAAI和IJCAI发表论文70余篇,论文被引用1.16万次(Google Scholar),指导学生在BraTS2020、KiTS21、KiPA22、SegRap2023等10余项国际学科竞赛中获得前三名;现为中国体视学学会理事、中国计算机学会数字医学分会常委、中国图象图形学学会视觉大数据专委会常委、陕西省计算机学会人工智能专委会主任。


论坛讲者信息

沈定刚

上海科技大学教授

报告题目:The Future of Medical Diagnostics: Integrating Ultrasound, Radiology, and Textual Data through
Foundation AI

报告摘要:I will introduce the ideas of integrating multimodality information (including radiological images and ultrasound images, as well as text and clinical report), under the framework of foundation AI model, for disease diagnosis, treatment selection, and outcome prediction. I will first introduce general information about applications of CLIP in medical applications, and then give some examples on thyroid nodule and breast nodule segmentation from ultrasound images. Finally, I will introduce our ongoing works on integration of different imaging and non-imaging information for tumor diagnosis and treatment selection. 

个人简介:Dinggang Shen is a Professor and a Founding Dean with School of Biomedical Engineering, ShanghaiTech University, Shanghai, China, and also a Co-CEO of United Imaging Intelligence (UII), Shanghai. He is a Fellow of IEEE, AIMBE, IAPR, and MICCAI. He was also a recipient of the Distinguished Investigator Award from The Academy for Radiological & Biomedical Imaging Research, USA (2019). He was Jeffrey Houpt Distinguished Investigator and a Full Professor (Tenured) with The University of North Carolina at Chapel Hill (UNC-CH), Chapel Hill, NC, USA, directing The Center of Image Analysis and Informatics, The Image Display, Enhancement, and Analysis (IDEA) Lab, and The Medical Image Analysis Core. Before that, he was also a tenure-track assistant professor in the University of Pennsylvanian (UPenn), and an Instructor in the Johns Hopkins University. His research interests include medical image analysis, computer vision, and pattern recognition. He has published more than 1600 peer-reviewed papers in the international journals and conference proceedings, with H-index 140 and over 85K citations. He serves as an Editor-in-Chief for Frontiers in Radiology, as well as an editorial board member for eight international journals. Also, he has served in the Board of Directors for MICCAI Society in 2012-2015, and was General Chair for MICCAI 2019.


厉力华

杭州电子科技大学教授

报告题目:面向肿瘤诊疗的医学影像智能计算

报告摘要:随着以深度学习为代表的人工智能技术的发展,医学影像的智能计算也取得极大的进步。本报告以肿瘤智能化诊疗为背景,介绍近年来团队在多参数影像、跨参数影像、纵向时序影像、跨模态影像、以及混合数据/影像智能计算方面所开展的几项研究工作,从临床视角分析影像智能计算在肿瘤诊疗上的潜在应用价值。

个人简介:厉力华,国家杰出青年科学基金获得者,“新世纪百千万人才工程”国家级人选,浙江省科技发展咨询委员会委员、之江实验室学术咨询委员会委员, IEEETEMS学会智慧医学数字化技术委员会理事、中国生物医学工程学会影像信息与控制专业委员会候任主任委员、中国图象图形学学会医学影像专业委员会副主任委员。曾在美国南佛罗里达大学工作多年,任职副教授。发表包括Nature子刊在内的高水平科研论文和国外著作章节200多篇(章),获授权专利20余项,其中两项美国专利被公司所采用并产业化。2012年获中国侨界贡献奖(创新人才)。


胡德文

CSIG常务理事,国防科技大学教授

报告题目:功能成像脑图谱与机器学习

报告摘要:脑功能区的精确标注,是阐明大脑功能和结构组织的基础,也是理解大脑如何工作的先决条件,而功能连接具有良好的个体内稳定性,是当前脑功能图谱绘制的主要依据,表现出功能连接相关性的脑区,在任务与认知过程中也紧密关联。我们提出了一种新型的本征聚类算法,基于体素间的功能连接指标,得到了世界上首个全脑功能图谱,后续又基于动态功能连接对图谱进行了细化,为脑功能成像研究提供了重要的参考。在此基础上,我们利用精细的全脑图谱进行大脑认知状态评估研究,充分验证了精细化剖分对于提升神经精神疾病诊断分类可靠性的重要意义。

个人简介:胡德文,国防科技大学智能科学学院教授,博士生导师,主要从事控制科学与工程、脑科学与认知科学等方面的研究,在神经计算及智能机器人控制等领域取得了系统性和创造性成果。是国家杰出青年科学基金获得者、教育部长江学者特聘教授、全国优秀科技工作者、国家“万人计划”领军人才,军队专业技术二级专家。出版学术著作10部,在Science Advances,Brain,PNAS及IEEE Transactions等发表SCI检索论文250余篇。成果“神经生物信息模式识别与时空分析”“功能成像的脑连接机理研究”分别获得2012年度和2018年度国家自然科学奖二等奖,2020年获全国创新争先奖状。


孙剑

西安交通大学教授

报告题目:智能影像分析的新型深度学习方法研究

报告摘要:本报告将以医疗影像所面临的快速成像与影像分析问题为背景,介绍解决医学快速成像的人工智能模型与数据双驱动方法,以及提升模型自适应能力的最优传输理论和方法。具体介绍两方面研究工作:(1)针对深度学习的黑箱特性以及可解释性不足的问题,介绍如何结合医疗影像的成像机制与领域知识,发展融入领域知识的医学成像模型驱动深度学习方法;(2)针对当前深度学习方法在多模态/多中心应用中的推广性和自适应能力弱的不足,介绍领域自适应、跨模态影像生成等方面的一些研究进展。

个人简介:西安交通大学数学与统计学院教授,获得国家杰出青年科学基金。长期从事人工智能(尤其是图像和医学影像分析)中的数学模型与算法研究,主要包括成像反问题与医学辅助诊断、解决人工智能泛化性瓶颈问题的基础模型与算法研究等,相关成果发表于IEEE TPAMI, IJCV, MIA, NeurIPS, CVPR, ICCV,MICCAI等;曾在微软亚洲研究院、法国巴黎高师、法国国家信息与自动化研究院等从事博士后或访问学者工作;获陕西省自然科学奖一等奖;担任教育部科技委委员、计算机视觉领域顶级国际期刊IJCV编委、ICCV/ECCV/MICCAI等领域主席。

 

浙江大学教授

报告题目:基于数据融合的辅助诊断研究

报告摘要:人工智能发展迅猛,在医疗应用中大放异彩。医疗数据种类多、模态复杂,在临床诊疗过程中医生往往结合多种模态数据,经综合诊断后给出结论。报告中探索三种数据融合辅助诊断:自身数据融合、多模态数据融合、时序数据融合。报告也会简要汇报浙大睿医人工智能研究中心研究成果。

个人简介:吴健,浙江大学求是特聘教授,教育部长江学者,浙江大学国际联合学院副院长、浙大睿医人工智能研究中心主任、人工智能医疗器械标准化技术归口单位专家组专家、中国计算机学会理事、中国卫生信息学会国际合作与交流专业委员会副主任委员、浙江省医疗数据产业研究会副理事长。研究兴趣集中在医学人工智能,发表SCI/EI收录论文100余篇。主持国家自然科学基金项目6项、国家重点研发项目子课题2项。2007年获教育部科技进步一等奖,2008年获浙江省科技进步一等奖,2009年获中国商业联合会科学技术特等奖,2010年获国家科技进步奖二等奖,2014年获浙江省科技进步一等奖,2018年获浙江省科技进步二等奖,2021年获中国计算机学会科技进步优秀奖,2022年获中国电子学会科学技术二等奖,2022年获中国产学研合作创新成果二等奖。


论坛联系人

姓名:卢虹冰

单位:空军军医大学

邮箱:luhb@fmmu.edu.cn

机器视觉与学习论坛

论坛简介

        机器学习是一门从已知数据中探寻未知规律和模式的艺术,如何以更少的代价取得更好的学习效果始终是其亟待解决的核心问题。随着机器学习技术在视觉等领域的发展和应用,传统学习算法在逐步向前迭代的同时,各式深度学习方法也在不断推陈出新,本次Workshop我们将邀请领域专家作为讲者,分享他们在该领域的最新工作,总结机器视觉与学习领域在相关核心问题上的近期进展和展望未来值得探索的方向。

论坛日程

论坛时间:2024年5月24日18:30-21:30

论坛名称:机器视觉与学习

主持人:林宙辰 、王奕森

论坛主席

林宙辰

CSIG理事、北京大学教授

个人简介:林宙辰,北京大学教授,IAPR/IEEE/CSIG Fellow,国家杰青,中国图象图形学学会机器视觉专委会主任,中国自动化学会模式识别与机器智能专委会副主任。研究领域为机器学习、 数值优化。发表论文 300 余篇,英文专著2本。获2020年度CCF科学技术奖自然科学一等奖。多次担任机器学习与人工智能顶级会议 CVPR、ICCV、NIPS/NeurIPS、ICML、IJCAI、AAAI 和 ICLR 的领域主席,曾任 IEEE T. Pattern Analysis and Machine Intelligence 编委,现任International J. Computer Vision、 Optimization Methods and Software 编委。


王奕森

北京大学助理教授

个人简介:王奕森,北京大学助理教授,博士生导师。主要研究方向为机器学习理论和算法,目前重点关注大模型的理论、安全等。已发表机器学习三大顶会ICML/NeurIPS/ICLR文章50余篇,多篇被选为Oral或Spotlight,获ECML 2021最佳机器学习论文奖、ICML 2021 Workshop最佳论文银奖、CVPR 2021竞赛第一等,研究成果被麻省理工科技评论(MIT Technology Review)和中国中央广播电视总台(CCTV)专题报道。主持基金委“下一代人工智能”重大研究计划项目、科技创新2030“新一代人工智能”重大项目课题。担任NeurIPS 2024 Senior Area Chair等。


 

论坛讲者信息

徐明亮

CSIG理事、郑州大学教授

报告题目:智能指挥决策

报告摘要:以探索研制国产化先进航保作业智能指挥决策系统为目标导向,将图形学、机器学习、多智能体系统等方法技术与指挥决策、数理优化、应急管理等理论结合,汇报从基础理论研究和装备系统研制方面的工作进展。

个人简介:徐明亮,郑州大学二级教授、博士生导师,科学技术研究院院长,计算机与人工智能学院、软件学院执行院长(兼),教育部智能集群系统工程研究中心主任,研究方向为人工智能与工业软件等。近年来主持国家自然科学基金杰青/优青/重点项目、国家科技支撑计划课题、国家重点研发计划课题、国家重大任务专项(国防)等国家级项目10余项,以及一批企业重大横向,在ACM/IEEE系列汇刊等本领域国际重要学术期刊与顶会发表论文100余篇,获国内外发明专利30余件,提出稳健智能、极限成像等创新理论,研制了航保作业指控系统、新型非视域成像仪器、工业质检服务平台等多套关键领域自主软件与装备,服务国防、制造、反恐等重大需求,产生了较好的国防、经济与社会效益。


 

张煜东

 东南大学教授

报告题目:X射线断层成像研发与图像后处理

报告摘要:常规CT和能谱CT技术为医生提供了全面的影像信息。在术中和放疗过程中,C-arm CT和机载CBCT能实时指导手术和治疗计划。此外,移动式和站立位CT使影像检查更加便捷,适用于各种场景。通过CT重建后,视觉转换器(ViT)模型在医学图像的分类、分割、分析等方面性能优越。ViT可捕获医学图像中复杂模式与微妙细节,提高诊断精度,并加快医疗人员决策。ViT模型的集成标志着一项变革性进步,为更可靠的医学图像分析技术铺平道路。

个人简介:张煜东,东南大学教授,博导。IET、EAI、BCS Fellow。2010年于东南大学获得博士学位。先后在美国、英国等多所大学从事教学科研工作。研究兴趣为人工智能与医学影像。已发表中国科学院一区二区100余篇论文。先后担任IEEE TCSVT、IEEE JBHI等重要学术期刊编委。主持参与多个国际学术项目,包括美国国立卫生研究院、英国工程物理科学研究理事会等。多次担任IEEE与ACM冠名会议大会主席。

张勇东

中国科学技术大学教授

报告题目:全媒体环境下智能传播技术体系

报告摘要:随着第五次传播革命不断发展,出现了全程媒体、全息媒体、全员媒体、全效媒体。信息无处不在、无所不及、无人不用的全媒体环境导致舆论生态、媒体格局、传播方式发生深刻变化,同时也给我国舆论安全和意识形态安全带来严峻挑战,急需发展以主流价值观为指导,社会传播理论和人工智能技术相结合的智能传播技术体系。本报告首先简述智能传播的当前背景,然后阐述智能传播难点挑战,最后深入探讨智能传播当前技术局限和下一步的解决路径。

个人简介:张勇东,教授,博士生导师,现任中国科学技术大学信息科学技术学院执行院长,人民日报社传播内容认知全国重点实验室首席科学家。国家自然基金委创新研究群体项目负责人(2021 年),“万人计划”科技创新领军人才 (2018 年),国家杰出青年科学基金获得者 (2015年)。曾获国家自然科学奖二等奖(排名第一,2019 年), 教育部技术发明奖一等奖(排名第一,2022年),中国电子学会科学技术奖(自然科学类)一等奖(排名第一,2018 年),国家科技进步奖二等奖(排名第五,2016 年),北京市科学技术奖一等奖 (排名第一,2014 年)。研究成果大规模应用于国家网络空间内容安全领域,取得了显著的应用效果。担任《中国通信》副主编,国家重点研发计划-“变革性技术关键科学问题”重点专项总体专家组成员,国家重点研发计划-“社会治理与智慧社会科技支撑”重点专项总体专家组成员。


 

陈刚

中山大学教授

报告题目:机器人视觉感知与智能加速器系统

报告摘要:机器人系统运动速度的提升必然会带来对系统整体响应时间的极高要求。同时,微小型移动机器人系统往往由于载荷、功耗、体积、算力的限制,其单体智能化程度也往往受到很大的限制。如何设计机器人视觉感知系统,使得其具有极高的运算效率以及高度集成度,同时保持现有精度、鲁棒性水平,是一个重大研究挑战。针对上述问题,本报告将探讨在计算力受限以及载荷受限情况下基于深度神经网络的实时立体视觉感知技术以及相应的硬件加速器设计方案。

个人简介:陈刚,中山大学教授,博士生导师。博士毕业于慕尼黑工业大学计算机系,本硕毕业于西安交通大学。主要从事机器人系统、智能系统与应用、嵌入式系统等方面研究工作;在近年来在相关领域的国内外学术会议及期刊上发表80+篇论文,其中在在 DAC、ICCAD、RTSS、CODES+ISSS、DATE、EMSOFT等顶级会议和TIP、TII、TC、 TCYB、TPDS, TCAD,TECS,TODAES等IEEE/ACM 汇刊上发表论文40篇以上。授权专利10项,集成电路登记证书1项;以第一作者或者通讯作者获得领域知名国际会议最佳论文(提名)6次,集成电路特别设计奖1次, 最佳系统演示奖2次,包括DATE 2021 (CCF-B类会议)、ICESS 2022、ICET 2021、ESTIMedia 2013最佳论文奖、ASP-DAC 2023特别设计奖 (Special Feature Award)以及FPL 2022(FPGA领域三大会议), CODES+ISSS 2020(CCF-B类会议)最佳论文提名奖,CCF-DAC 2023最佳原型系统演示奖,CACAI 2023 最佳原型系统演示奖亚军。


 

王奕森

北京大学助理教授

报告题目:数据增广图视角下的表示学习理论

报告摘要:表示学习近年来在多个领域取得了巨大的成功,比如自监督学习无需数据标注即能获得很好的数据表示,成为近期一些列重要工作(CLIP,ChatGPT)中的核心技术之一。本报告将探讨自监督学习中的对比学习(Contrastive Learning)、掩码学习(Mask Image Modeling)、多模态学习(CLIP)背后的工作机理,从理论视角分析其优化过程和下游泛化能力,期望为自监督学习的算法设计提供一些新的见解。

个人简介:王奕森,北京大学助理教授,博士生导师。主要研究方向为机器学习理论和算法,目前重点关注大模型的理论、安全等。已发表机器学习三大顶会ICML/NeurIPS/ICLR文章50余篇,多篇被选为Oral或Spotlight,获ECML 2021最佳机器学习论文奖、ICML 2021 Workshop最佳论文银奖、CVPR 2021竞赛第一等,研究成果被麻省理工科技评论(MIT Technology Review)和中国中央广播电视总台(CCTV)专题报道。主持基金委“下一代人工智能”重大研究计划项目、科技创新2030“新一代人工智能”重大项目课题。担任NeurIPS 2024 Senior Area Chair等。


 

彭家德

阿里巴巴智能信息事业群夸克事业部算法专家

报告题目:多模态文档内容理解技术的应用与挑战

报告摘要:介绍多模态文档技术的研究现状和应用现状,结合夸克的业务介绍夸克对于多模型文档内容技术的理解,以及夸克的实际应用面临的挑战和解决方案。

个人简介:彭家德,阿里巴巴智能信息事业群夸克事业部,算法专家,夸克开放平台技术负责人,夸克AI应用技术负责人。2017年硕士毕业于中国科学技术大学,工作方向为人工智能、机器视觉、文档分析与理解、OCR、多模态信息抽取和内容结构化等。近年来专注于文档图片多模态理解,负责开发的印刷文字识别、手写文字识别、公式识别和文档智能理解支持夸克、淘天集团、阿里健康、Lazada、橙翼、本地生活、钉钉等多个BU的核心业务。


 

论坛联系人

姓名:王奕森

单位:北京大学智能学院

邮箱:yisen.wang@pku.edu.cn

智能光学成像前沿发展论坛

论坛简介

        随着人工智能等前沿信息技术的发展,成像技术越来越需要软硬协同优化以更好地感知真实世界,智能光学成像就是将人工智能和光学技术相结合,其快速发展为各个行业带来了更高效、更精确的成像和分析能力,已经在医疗诊断、工业生产、智能交通、农业管理等领域带来了革命性的变化。本论坛由虚拟现实专委会承办,论坛将聚集来自学术界和工业界的专家,共同探讨智能光学成像的最新进展、挑战和应用,通过分享和交流,我们将促进跨学科的合作,推动智能光学成像领域的研究和创新。

论坛日程

论坛时间:2024年5月25日 14:00-17:20

论坛名称:智能光学成像前沿发展

主持人:王涌天、宋维涛

论坛主席

王涌天

CSIG副理事长、会士,北京理工大学教授

个人简介:王涌天,北京理工大学杰出教授,长江、杰青,光电学院和计算机学院博导,北京市混合现实与新型显示工程技术研究中心主任。兼任全国信息技术标准化技术委员会委员、虚拟现实与增强现实标准工作组组长,中国图象图形学学会副理事长,中国光学工程学会常务理事,中国光学学会监事,中国计算机学会理事,北京图象图形学学会理事长,北京光学学会副理事长,并先后被国际工程光学学会(SPIE)、英国工程技术学会(IET)、美国光学学会(OSA)、中国光学学会(COS)、中国仪器仪表学会(CIS)、中国图象图形学学会(CSIG)评选为会士(Fellow)。


宋维涛

北京理工大学准聘教授

个人简介:宋维涛 ,北京理工大学光电学院准聘教授,博士生导师,国家级青年人才计划入选者,主要研究方向包括颜色科学、新型显示与人机交互等。北京理工大学光学工程学科博士,新加坡南洋理工大学电子电气工程学院博士后,曾在美国康涅狄格大学电子工程学院进行访问研究。发表在Nature Communications、Laser & Photonics Reviews、IEEE TVCG等著名学术期刊论文多篇,获得授权国家发明专利十余项。担任国际标准化组织ISO/IEC SC24专家组成员,中国照明学会视觉与颜色专委会副主任委员,中国图象图形学学会虚拟现实专委会秘书长,北京图象图形学学会理事,中国计算机学会人机交互专委会委员等。


 

论坛讲者信息


王琼华

CSIG理事、北京航空航天大学教授

报告题目:集成成像光场3D显示技术

报告摘要:集成成像光场3D显示技术是一种重要的裸眼3D显示技术。本报告将概述3D显示技术;详细介绍团队研制的桌面集成成像光场3D显示器和高清晰集成成像光场3D显示器,前者实现了360°水平环视和立体感好的3D显示效果,后者获得了清晰度和舒适度好的3D显示效果;最后展望集成成像光场3D显示的发展前景。

个人简介:王琼华,北京航空航天大学仪器科学与光电工程学院博士生导师、教育部长江学者特聘教授、国家杰出青年科学基金获得者、国家“万人计划”科技创新领军人才、国际信息显示学会、美国光学学会、美国光学工程学会和中国光学学会会士、中国图象图形学学会理事、三维成像与显示专业委员会主任、PhotoniX等期刊编委、国家重点研发计划等项目负责人。研究方向为显示与成像技术。研制了裸眼3D显示器和连续光学变焦显微镜等,获得数项省部级科技奖励,获准160余件美国和中国发明专利,出版科学出版社书籍3部,发表SCI收录论文350余篇。1988-2001年在电子科技大学获得学士、硕士、博士学位和任职到副教授,2001-2004年在美国中佛罗里达大学做博士后,2004-2018年在四川大学任教授。


 

司徒国海

中国科学院上海光学精密机械研究所研究员

报告题目:深度学习下的计算成像实践探索:从数据驱动向物理驱动发展

报告摘要:近年来,深度神经网络(DNN)在解决计算成像过程中展示出卓越的能力,通常深度神经网络应该通过大量数据进行训练,过程缺乏物理解释模型,也往往泛化能力有限。为了解决这些问题,将物理模型纳入到DNN的训练中来,形成物理增强深度神经网络这一新的架构,简称PhysenNet。报告简要回顾了包括鬼成像、相位成像和散射成像等该领域的工作,并展示物理驱动的Physenet不需要任何数据来训练,它满足相应物理模型所施加的约束,还可以用来解决光学成像以外的许多其他问题

个人简介:司徒国海,中国科学院上海光机所研究员、国家杰青、美国光学学会Fellow。近年来致力于发展基于人工智能的计算光学成像技术,解决在强散射、弱光照等极端环境中的成像问题,取得多项原创性研究成果。在Nature Photonics等期刊上发表具有重要影响力的学术论文100篇,连续三年入选Elsevier高被引中国学者榜;先后在40多个重要国际学术会议上作大会\主旨\辅导\邀请报告。


 

邵晓鹏

西安电子科技大学教授

报告题目:计算成像时代的图像处理革命

报告摘要:计算成像的本质是光场的获取和解译。与传统成像不同,计算成像往往获取的是高维度光场数据,于是就面临着光场的解译问题。受成像范式影响,不同成像模式的图像解译方法也不同;同时,需求不同,高维度光场数据的应用方式也会发生变化。报告将从成像范式讲起,以具体的成像范式为案例,详细讲述如何应对计算成像时代带来的图像处理问题。

个人简介:邵晓鹏,西安电子科技大学光电工程学院院长,西安市计算成像重点实验室主任,173重点项目首席,科普专栏作家。现任国家部委2个专业组专家,中国光学工程学会常务理事、中国光学学会理事、陕西省光学工程学会理事长、陕西省光学学会副理事长、西安市激光红外学会副理事长,中国光学工程学会计算成像专委会主任。光学工程学科带头人、西安市计算成像重点实验室主任、陕西省新体制光电成像与感知科技创新团队负责人、陕西省创新人才推进计划中青年科技创新领军人才。国内最早计算光学成像技术人员之一,计算成像技术联盟发起人,全国计算成像技术与应用研讨会发起人。发表论文200余篇,被引2100余次。


 

付莹

北京理工大学教授

报告题目:数据与模型联合驱动的计算光谱成像

报告摘要:计算光谱成像是计算成像的重要研究方向之一。近年来,数据驱动的深度神经网络方法在解决计算光谱成像过程中展示出卓越的能力,但是其往往需要大规模真实成对数据进行训练,面临泛化性弱、可解释性差等一系列问题。为了解决上述问题,模型驱动方法与数据驱动方法相结合受到越来越多的关注。本报告将关注光谱耦合采集、解耦重建、高灵敏度成像等任务,发挥数据驱动与模型驱动方法各自的优势,实现高质量光谱图像获取。

个人简介:付莹,北京理工大学教授,博士生导师。2017年入选海外高层次青年人才引进计划。主要从事计算机视觉、计算摄像、图像/视频处理等相关领域研究,近五年以第一/通讯作者在中科院一区期刊和计算机机学会推荐A类会议发表论文50余篇,授权发明专利30余项。获计算机学会推荐 A类国际会议ICML杰出论文奖和国际会议PRCV最佳论文奖,主持国家自然科学基金重点项目等国家级项目/课题10余项,获中国指挥与控制学会科学技术进步奖一等奖、人工智能学会教学成果奖励计划一等奖、图象图形学会石青云女科学家奖。


 

论坛联系人

姓名:宋维涛      

单位:北京理工大学

邮箱:swt@bit.edu.cn