技术论坛1:元宇宙时代的网络图形学的挑战、关键技术与机遇 |
---|
论坛召集人:贾金原 |
---|
论坛讲者:乔秀全、杨柏林、熊卫丹、刘畅 |
召集人简介:贾金原,于1984年毕业于内蒙古大兴安岭林业师范学校,1991年硕士毕业于吉林大学,2004年博士毕业于香港科技大学。2008年至2023年期间,任职于同济大学软件学院教授,创建了智慧三维图形实验室。他始终坚持工程应用驱动的研究模式,深耕轻量级Web3D关键技术长达20余年,提出了算传渲一体化的轻量级细粒度化Web3D关键技术研究框架,发表了50余篇高质量Web3D学术研究论文,先后四次获得了中国虚拟现实大会最佳论文奖,两次获得国际会议最佳论文奖(ACM Web3D与Edutainment),获得了13项发明专利,所有专利技术均成功应用于在线虚拟现实、虚拟仿真、BIM、智慧城市、数字孪生与元宇宙等Web3D示范项目。贾教授于2021年增选为中国图学学会常务理事,同年创办网络图形学专委会并担任首届主任。2022年被印尼科学院评为G20 Professorship特邀专家,并在同年的巴厘岛G20峰会上做Web3D元宇宙主旨演讲。2024年被聘为长三角元宇宙专家委员会副主任委员。先后获得上海科技进步一等奖、中国产学研合作(个人)创新奖与工匠精神奖以及中国图学学会科技进步二等奖等。2024加盟香港科技大学(广州),入职低空经济研究院,担任主任工程师(Principal Engineer),担任智能交通和城市治理与设计学域的实践教授(Professor of Practice)。 |
报告题目:基于体积视频的沉浸式实时通信与交互技术 |
|
报告摘要:体积视频(Volumetric Video)是一种可以捕获三维空间中信息(如深度信息和色彩信息等)并生成三维模型序列的技术,这些三维模型连起来就形成了可以在任意视角观看的全新视频格式,可以广泛应用于AR/VR、元宇宙应用中。然而,现有体积视频应用基本上都是离线处理的型态,基于体积视频的实时通信在采集、传输和重建方面面临着巨大挑战。本报告介绍课题组近几年在“通信+AI”方面的相关研究进展,包括基于AI的点云实时传输、多用户交互和分布式渲染等。 |
|
报告人简介:乔秀全,北京邮电大学特聘教授、教育部长江学者、享受国务院特殊津贴专家、中国图学学会网络图形学专委会副主任、中国指挥与控制学会公共大数据安全专委会副主任、国家虚拟现实创新中心专家委员会委员。担任SCI检索期刊IEEE Transactions on Multimedia、China Communications和Springer Computing等期刊编委。主要研究5G/6G、元宇宙、扩展现实技术。承担包括重点研发项目课题和973课题等10多项国家级项目课题,近5年在中科院大类一区/CCF A类权威期刊JSAC、TPAMI、TMC、INFOCOM、CVPR、ACM MM、TMM等上发表30多篇高水平学术论文。牵头获2022年中国电子学会科学技术奖技术发明一等奖,参与获北京市科技进步一等奖和中国通信学会技术发明一等奖。 |
报告题目:大规模多模态数据融合压缩处理与实时传输方法研究 |
|
报告摘要:近年来,数据编码和流传输技术在数据压缩和实时传输的应用取得了显著进展,主要体现在数据结构信息挖掘、时空一致性表示和渐进式传输编码上,使得单模态数据能够实现高精度、低延迟的压缩和传输。但是该技术的广泛应用主要还面临着如何在大规模多模态数据中实现高效准确的压缩和传输的技术难点。本报告将介绍我们借助近年来快速发展的深度学习技术,通过数据融合压缩传输方法在大规模多模态数据融合压缩处理与实时传输上取得的一些进展,这些研究成果实现了大规模多模态数据的编解码压缩功能,显著提高了实时传输的效率和准确率。 |
|
报告人简介:杨柏林,现任浙江工商大学研究生院院长、教授、博导,围绕数据传输编码开展计算机图形学、计算机视觉、人工智能等研究工作,当前的研究题目包括实时编码传输、多模态数据理解、三维重建等,主持国家和省部级项目二十余项,在著名国际期刊、重要国际会议以及国内一级期刊上发表SCI/EI收录论文80多篇,荣获省部以上科技进步奖9项,授权发明专利40余项,并应用于中南卡通、宇泛等企事业单位。 |
报告题目:面向大规模场景的细粒度模型轻量化技术 |
|
报告摘要:随着主动传感、多视角立体视觉、无人机摄影测量等技术的发展,面向大规模城市场景的三维重建技术已取得显著进展。然而,重建所得的城市模型通常具有数据量庞大、结构复杂、精细度高等特点,给后续在多样化场景中的应用带来了巨大挑战。本报告分享我们在城市场景模型轻量化方面取得的进展,包括点云实例化与代理模型纹理重映射,在现有网络架构与渲染管线内,有效平衡场景的视觉质量与数据量。 | |
报告人简介:熊卫丹,现为深圳大学助理教授。2019年博士毕业于香港科技大学,2019年至2022年先后担任腾讯工程师、新加坡南洋理工大学博士后、人工智能与数字经济广东省实验室(深圳)副研究员。深入接触跨领域研究,包括图形学、建筑工程、人工智能与增材制造等,主要研究方向为三维建模与几何优化,相关成果发表于ACM TOG、IEEE TVCG 、CAD等相关领域的顶刊顶会,应用于惠普、Sane Form等企业。 |
报告题目:轻量级Web3D在线高品质端云协同实时渲染
|
|
报告摘要:在移动互联网时代,Web3D技术对现有浏览器和邮件系统等带来变革和颠覆性影响,成为互联网的新入口。然而, Web3D的实时渲染受Web内核、图形库以及外部设备的影响,渲染表现与桌面级平台有较大差距。本次报告将从Web3D实时渲染技术入手,探讨利用边缘/云计算资源共同分担渲染任务的技术框架。通过基于深度强化学习的渲染资源调度策略,精确增强Web3D应用的前端算力。提升Web3D图形处理效率和质量的同时确保渲染的实时性。 | |
报告人简介:刘畅,南昌航空大学信息工程学院人工智能专业负责人,硕士生导师,同济大学博士,新加坡国立大学访问学者,中国图学学会网络图形学专委会秘书长。主要从事Web3D端边云协同渲染,轻量级WebVR技术等方面的研究。主持或参与国家自然科学基金5余项,在中国科学、ACM TOMM、中国图象图形学报等国内外期刊发表论文30余篇,授权发明专利10余项。 |
技术论坛2:大场景重建与渲染 |
---|
论坛召集人:邵天甲 |
---|
论坛讲者:张举勇、郭延文、申抒含、周晓巍、丁文超 |
召集人简介:邵天甲,浙江大学CAD&CG国家重点实验室百人计划研究员、博士生导师,获国家基金委优秀青年基金资助。之前在英国利兹大学(University of Leeds)担任Lecturer(终身教职)。本科毕业于清华大学自动化系,博士毕业于清华大学高等研究院,师从微软亚洲研究院副院长郭百宁教授。研究方向是计算机图形学,包括三维场景重建,数字人建模、3D AIGC等。已在计算机图形学和视觉的顶级期刊和会议(TOG, SIGGRAPH, TVCG, CVPR等)发表CCF-A类论文40余篇。他是ACM SIGGRAPH 2022/2023程序委员,CVM 2022程序委员会共同主席,现担任国际期刊《The Visual Computer》编委,中国电子学会虚拟现实分会秘书长。 |
报告题目:基于辐射场渲染的大场景重建与实时渲染
|
|
报告摘要:近年来,NeRF、3DGS等可微渲染技术在大规模场景重建中取得了显著突破,但在消费级设备上的高效高保真实时渲染上仍面临许多挑战。本次报告将介绍课题组在大规模场景重建与实时渲染方面的一系列研究工作。我们通过适配Web端的分块与层次细节(LOD)渲染策略、专为倾斜摄影设计的高效采样方法与正则化策略,以及可扩展的渐进式分块几何重建技术,从多个角度优化大场景的内存占用、渲染速率以及重建精度。在这些工作基础上,我们实现了大规模场景的高精度几何重建及消费级设备上的高效实时渲染。 | |
报告人简介:张举勇,中国科学技术大学数学科学学院教授,获国家基金委优秀青年基金、中科院青促会优秀会员资助。2006年本科毕业于中科大计算机系,2011年博士毕业于新加坡南洋理工大学,2011年至2012年于瑞士联邦理工学院洛桑分校从事博士后研究。研究领域为计算机图形学与三维视觉,近期主要研究兴趣为基于神经隐式表示、逆向渲染与数值优化方法对真实物理世界进行高效高保真三维数字化,以及高真实感虚拟数字内容的创建。
|
报告题目:再审视三维场景重建:一个已经彻底解决的问题? |
|
报告摘要:三维场景重建是计算机图形学和视觉领域研究的传统问题,迄今有很多经典的技术和基于深度学习的方法被提出。然而针对虚拟现实、数字孪生和元宇宙等的应用,工业界的解决方案主要是三维建模师借助建模软件手工搭模,工作量大且效率低下。针对现实场景的高质量、结构化重建依然是没有彻底解决的问题。近年来,三维计算机视觉的研究取得了显著进步,推动了针对三维场景的分析理解,本报告首先回顾目前三维场景重建的技术进展,进而介绍我们以三维场景分析理解为基础,实现三维场景高质量、结构化重建的研究思路、方案和进展,我们的研究成果在针对流程工业的智能化重建方面进行了实践,提升了针对流程工业搭建智能工厂和数字孪生的效率。
|
|
报告人简介:南京大学教授、博导,计算机软件新技术全国重点实验室研究人员。浙江大学博士、美国伊利诺伊大学香槟分校、香港大学等访问学者。主要研究方向为计算机图形学和三维计算机视觉,研究成果发表在ACM TOG, IEEE T-PAMI/TIP/TVCG/TGRS、《中国科学》等领域顶级期刊和Siggraph, NIPs/ICCV/CVPR/ECCV/VR等顶级会议,获授权发明专利30余项,主持国家自然科学基金重点项目和十三五装发预研等国家级重要研目以及江苏省杰出青年科学基金研目,团队负责与华为、OPPO、三星等头部公司合作项目二十余项。担任中国图像图形学会理事,江苏省计算机学会图形图像专委会主任和江苏省工程师学会虚拟现实与元宇宙专委会主任,获华为公司“难题揭榜”火花奖等。
|
报告题目:大规模场景高精度位姿解算与结构化三维建模
|
|
报告摘要:对大规模复杂场景进行高精高效的三维重建与理解,包括三维几何重建、三维语义理解、三维结构表达等,是数字城市、无人系统、工业孪生等领域的共性需求。在这一研究中,计算机视觉、摄影测量、机器人等多个领域的研究不断交叉融合,几何视觉方法与深度学习方法也在不断发生碰撞。本次报告将从几何和学习的视角介绍我们在大规模场景高精度位姿解算与结构化三维建模方面的最新研究进展,以及在实景三维重建、室内BIM建模、工业三维孪生等领域的实际应用。
|
|
报告人简介:申抒含,中国科学院自动化研究所研究员、博士生导师,中国科学院大学人工智能学院岗位教授,中国科学院工业视觉智能装备技术工程实验室副主任。研究领域为三维计算机视觉理论与应用,包括大规模场景三维重建、智能机器人三维环境感知、场景三维语义理解等。在计算机视觉、摄影测量、机器人等领域国际期刊和国际会议发表论文90余篇。作为项目负责人主持国家自然科学基金联合重点项目、北京市自然科学基金联合重点项目、以及各类企业研发项目20余项。入选中科院青年创新促进会、中科院自动化所特聘青年骨干、中科院特聘研究岗位,曾获2016年ACM北京新星奖、2018年中国图像图形学会科学技术二等奖、2023年中国测绘学会科学技术一等奖、2023年中国自动化学会自然科学一等奖等。
|
报告题目:大规模动态场景的重建与渲染
|
|
报告摘要:近年来以NeRF、3DGS为代表的神经表达技术为三维场景的重建与渲染提供了新的技术途径,在重建稳定性、渲染真实感等方面相较于传统MVS方法也体现了巨大优势,但在处理大规模场景和动态场景等方面仍存在局限。本次报告将介绍我们课题组在这些方面的最新工作,主要包括大规模场景的高效表达方法Level of Gaussians,动态街景的建模方法StreetGaussians,以及动态场景神经表达重建与渲染开源软件EasyVolcap。
|
|
报告人简介:周晓巍,浙江大学研究员,国家级青年人才项目入选者。研究方向主要为三维视觉及其在混合现实、机器人等领域的应用。近五年在相关领域的顶级期刊与会议上发表论文70余篇,多次入选CVPR最佳论文候选。曾获得浙江省自然科学一等奖,陆增镛CAD&CG高科技奖一等奖,CCF优秀图形开源贡献奖,入选全球前2%顶尖科学家榜单、中国高被引学者。担任国际顶级期刊IJCV编委、顶级会议CVPR/ICCV领域主席,图形学与混合现实研讨会(GAMES)执行委员会主席,视觉与学习研讨会(VALSE)常务委员,CSIG三维视觉专委会常务委员。
|
报告题目:具身自动驾驶场景理解
|
|
报告摘要:近年来,自动驾驶算法被不断重塑,端到端神经网络将感知、预测、决策、规划等模块逐步融合吸收。但是端到端算法对数据的巨大依赖是主要问题。本报告将分享在具身智能以及端到端NN化的背景下自动驾驶的新思路。在场景理解方面,本报告将阐述开放语义的神经隐式表征在场景理解、仿真以及数据合成等方面的新进展。在决策规划方面,将分享如何融合多模态大模型的能力以进一步提升自动驾驶的常识以及高阶认知。
|
|
报告人简介:丁文超,复旦大学工程与应用技术研究院青年研究员。博士毕业于香港科技大学电子及计算机工程系,主要从事机器人的感知和预测决策方向研究。曾任职华为车BU智能驾驶产品部(ADS),获华为“天才少年”,担任ADS预测决策团队负责人,作为核心贡献者参与打造了华为ADS1.0以及ADS2.0智能驾驶系统,贡献了业界领先的智能驾驶预测方案,并实现在北汽极狐、长安阿维塔以及问界等多款车型上的商用。2023年加入复旦大学,入选上海市白玉兰浦江人才计划、小米青年学者等。近5年来以第一/通讯作者身份在TRO、JFR、RAL、AAAI、ICRA等顶级期刊和会议上发表高质量论文十余篇,获IEEE ROBIO 2023最佳论文提名奖。
|
技术论坛3:学术新星论坛 |
---|
论坛召集人:韩晓光 |
---|
论坛讲者:窦志扬、胡文博、刘圳、龙霄潇、叶卉、张彪、张萌、张少魁 |
召集人简介:韩晓光博士,现任香港中文大学(深圳)理工学院助理教授。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文100余篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。曾担任CVPR、NeurIPS、ECCV等领域主席,Siggraph Asia 程序委员,同时也是IEEE TVCG 以及 Computer&Graphics 的编委。他的工作曾两次获得CCF图形开源数据集奖,曾两次入选CVPR最佳论文列表。 |
论坛形式: |
---|
讲者每人 5分钟报告 + “读博那些事”主题分享研讨 |
报告题目:基于几何、拓扑与物理先验的4D内容分析与生成
|
|
报告摘要:4D内容的分析、重建和生成是一个重要的研究问题,其中4D包括三个空间维度(𝑥, 𝑦, 𝑧)和一个时间维度(𝑡),如形状和运动。该研究不仅涉及静态物体,还覆盖了随时间变化的动态过程,旨在全面理解现实世界的空间与时间变化规律。这些技术在虚拟现实、具身人工智能和机器人等领域具有广泛应用。该报告将主要汇报以下进展:结合几何、拓扑和物理的先验知识设计开发有效的4D内容恢复与分析方法,同时提升4D内容生成的质量、效率以及可用性。 | |
报告人简介:窦志扬是香港大学计算机科学系的博士四年级学生,师从王文平教授和Taku Komura教授。他现在在宾夕法尼大学的Grasp Lab和图形学实验室访问刘玲洁教授。他的研究兴趣包括计算机图形学、几何处理、角色动画和物理仿真动画。他的研究成果发表在SIGGRAPH、SIGGRAPH ASIA、EUROGRAPHICS、ACM TOG、TVCG、SGP、CVPR、ICCV、ECCV等国际顶级会议和期刊。他曾获SIGGRAPH最佳论文奖、CGF年度高被引论文奖、港大基金会2023/24学年优秀博士生奖等。他现阶段的研究重点是将几何、拓扑和物理的先验融入到4D数据的获取、分析与生成过程之中。
|
报告题目:Unleashing the Capability of Video Diffusion Models for 3D Vision |
|
报告摘要:视频扩散生成模型已经取得了长足的进步,展现出了强大的对世界的生成和理解能力。三维视觉关注内容在3D世界中的理解,交互,和生成。高质量3D数据的稀缺和难获得性是三维视觉领域的普遍问题。本报告关注如何利用视频生成模型对世界强大的理解和生成能力来促进三维视觉问题的进步,包括新视角合成,深度估计,以及沉浸式内容生成。
|
|
报告人简介:胡文博,腾讯AI Lab 研究员,于2022年在香港中文大学获得计算机科学与工程博士学位。研究兴趣位于计算机图形学,视觉,和人工智能的交叉点,近期研究主要集中在3D神经表示,重建,渲染,理解,以及生成。在SIGGRAPH, SIGGRAPH Asia, CVPR, ICCV, ECCV等发表二十余篇论文,所作工作曾获ICCV 2023 Best paper finalist,以及多次口头报告。个人主页:https://wbhu.github.io/
|
报告题目:显式三维表征的生成与理解
|
|
报告摘要:图形学相关的下游任务与应用中,三维资产常常以显式表征的形式建模。如何让模型生成、理解这些表征?本次报告里,我将基于这个主题简单分享我们近期在两个方面的工作:利用三维表征重建数据并训练用于建模三维网格的分布的扩散模型,以及探究语言大模型的在一般语言任务上的推理能力与显式三维表征上的理解能力之间的联系。
|
|
报告人简介:刘圳目前是Mila研究所和蒙特利尔大学的博士生,师从Liam Paull和Yoshua Bengio,本科与硕士毕业于佐治亚理工学院。他同时也是德国马克思普朗克智能系统所的访问学生,导师为Michael J. Black和Bernhard Schölkopf。他近期的主要研究方向是三维表征与生成模型。他将于2025年春季入职香港中文大学(深圳)任助理教授一职。
|
报告题目:自动驾驶场景建模,从三维重建到世界模型
|
|
报告摘要:场景建模是实现自动驾驶的重要环节,涵盖识别、决策、仿真等多个方面。本报告首先介绍了三维高斯泼溅技术在自动驾驶场景中的应用,针对视角稀疏和反光等问题提出了一系列解决方案。然而,单靠三维重建技术,仍不足以构建应对现实世界中非结构化、高度复杂的安全驾驶系统。一个关键挑战是如何有效预测环境变化下车辆可能产生的多种潜在行为。为应对这一挑战,我们提出了一种新的生成式世界模型。该模型采用自回归架构,仅需少量图像输入和车辆位姿控制信号,即可生成长序列视频。
|
|
报告人简介:龙霄潇,香港科技大学博士后。2023年博士毕业于香港大学,2018年本科毕业于浙江大学。 主要研究方向为3D内容生成、神经渲染、3D曲面建模、基于图像的深度/法向估计、基于图像的3D重建。 在TPAMI、CVPR、ICLR、ICCV、ECCV等顶会顶刊发表论文二十余篇。 主要有Craftsman3D、Wonder3D、SyncDreamer、SparseNeuS、GeoWizard、GaussianPro等3D AIGC、重建、渲染工作。
|
报告题目:利用移动端增强现实的三维内容和交互原型设计技术
|
|
报告摘要:三维内容制作和交互设计目前主要依赖于专业设计师、艺术家和程序员。然而,随着技术的进步,普通用户对创建自定义内容及交互的需求日益增加。增强现实(AR)技术的出现为创作提供了更大的自由度,但AR内容与真实环境的紧密结合对普通用户仍具挑战性。为此,我们提出了Pro-AR系列工作,旨在简化AR内容创建和交互设计的过程。该系列包括针对人的空间和手势交互的原型设计技术ProGesAR(CHI 2022)、针对智能物体的空间交互的原型设计技术ProObjAR(CHI 2023)、以及支持真实与虚拟内容交互的可视化编程工具 ProObjAR(2024)。我们希望通过AR的特性,实现现场(in-situ)真实与虚拟内容的交互,使专业人士及普通用户都能轻松将他们的AR愿景变为现实。
|
|
报告人简介:叶卉,香港科技大学博士后。2022年于香港城市大学获得博士学位,导师为傅红波教授,并随后获得香港研资局博士后资助(RGC Postdoctoral Fellowship)。研究方向为人机交互和计算机图形学的交叉领域,特别是新型移动端增强现实的内容创建、交互设计和编程技术。研究成果发表于SIGGRAPH(TOG),ACM CHI,IEEE TVCG等会议和期刊。担任CVM 2025大会的共同组织主席,同时也是CSCW、PG等会议的程序委员会委员,并担任SIGGRAPH(Asia)、CHI、TOG、TVCG等会议和期刊的审稿人。更多代表性成果可见个人主页:https://huiye19.github.io/。
|
报告题目:Exploring Representations for 3D Generative Models
|
|
报告摘要:In this study, we investigate generation models for 3D objects, representing objects as Signed Distance Functions (SDFs). Firstly, we introduce sparsity into 3D object representations, demonstrating its utility as a generative model and affirming the significance of sparsity in 3D object representation. Subsequently, we explore compressing objects entirely into a set of vectors, which not only incorporates sparsity but also eliminates the need for manually designing sparse structures. We establish its efficacy as a generative model, yielding exceptionally good generation results. Furthermore, we reveal that 3D object representation is essentially an infinite-dimensional function. We demonstrate the feasibility of bypassing representation learning and directly employing generation models on infinite-dimensional functions. These findings shed light on novel approaches to 3D object generation and pave the way for more efficient and effective modeling techniques.
|
|
报告人简介:Biao Zhang is a researcher specializing in 3D computer vision. He earned his Bachelor's and Master's degrees from Xian Jiaotong University and completed his Ph.D. at KAUST. His recent research focus is on 3D generative models, with publications in CVPR, NeurIPS, ICLR, and SIGGRAPH.
|
报告题目:高保真服装仿真细节增强
|
|
报告摘要:高保真服装依赖于高分辨率的几何表达,其计算代价高昂,且占用大量数据存储和传输资源,难以适用于低预算、普惠型应用场景。相比之下,低分辨率服装仿真计算高效,但牺牲了服装动态表现的细腻感和真实感。在虚拟数字人领域,如何高效节能地生成高保真服装仿真动画是一个极具挑战性与迫切性的课题。针对这一难题,本报告介绍一种服装动画细节增强的方法,以低分辨率服装仿真为输入,通过高分辨率服装动态细节增强,从而生成高保真的服装仿真动画。该方法将物理仿真与深度学习理论框架相结合,提出高保真服装仿真研究的新思路。
|
|
报告人简介:张萌,南京理工大学副教授。2019年3月博士毕业于浙江大学计算机学院,博士生导师为周昆教授。2019年8月至2022年7月,赴英国伦敦大学学院(UCL)进行博士后研究,合作导师为Niloy J. Mitra教授。2022年9月以副教授身份入职南京理工大学计算机学院。研究兴趣为以数字人为应用场景、以深度学习为算法框架的三维建模、纹理合成、动态仿真、图像渲染,在Siggraph(Asia)、EG等计算机图形学国际顶级会议上发表多篇论文,并担任Siggraph(Asia)、PG等多个知名国际期刊、会议审稿人或执行委员。
|
报告题目:数字三维场景交互构建方法及系统
|
|
报告摘要:数字三维场景构建是计算机图形学中的重要研究领域,能辅助数字三维内容创作,是数字内容生成与数字化产品等产业的重大需求的技术基础。现有的场景交互构建方法难以直接输入用户偏好,而是需借助用户同三维环境中的物体交互以指导场景生成,导致场景交互构建仍门槛高、效率低。在控制场景构建过程的基础上,场景交互构建的易用性是定制化构建三维场景的必要难点,也是决定用户体验的关键步骤。本报告聚焦针对数字三维场景的智能交互系统,包括基于物体交互构建场景、基于物体组交互构建场景、场景视点推荐和其他相关场景应用探索。
|
|
报告人简介:张少魁为清华大学计算机系博士后/助理研究员,他于2023年6月在清华大学计算机系获博士学位,师从张松海副教授。研究方向为计算机图形学、数字三维场景构建,已在相关领域发表6篇唯一一作CCF-A类期刊/会议长文。主持国家自然青年科学基金项目和中国博士后科学基金面上资助项目。入选清华大学“水木学者”、国家资助博士后研究人员计划(B档)、北京市科协2024-2026年度青年人才托举工程(责任导师:胡事民院士)和北京图象图形学学会优博。相关数字场景算法已在索菲亚、酷家乐、构家、不鸣科技应用。个人主页:https://cg.cs.tsinghua.edu.cn/Shao-Kui/
|
技术论坛4:虚拟数字人 |
---|
论坛召集人:张盛平 |
---|
论坛讲者:李坤、郭玉东、潘烨、张鸿文、李帅 |
召集人简介:张盛平,哈尔滨工业大学教授、如本科技首席科学家,入选国家级青年人才计划,美国布朗大学和香港浸会大学博士后、加州大学伯克利分校访问学者。主要研究方向为3D视觉。主持国家自然科学基金4项、华为公司项目10余项,被华为授予2021年“HUAWEI Ascend Expert”和 2022年“昇腾众智星光奖”荣誉称号,荣获教育部-华为“智能基座”栋梁之师。研究成果获省部级科研奖励4项。已发表学术论文100余篇(包括PNAS、IEEE T-PAMI、IJCV、ICML、CVPR、ICCV、SIGGRAPH等)。 |
报告题目:单彩色相机实时人体三维重建、渲染与生成 |
|
报告摘要:低成本、高质量、实时人体重建与渲染是数字人领域重要的研究目标与方向。本报告将重点介绍本研究组在该方面的探索:为了实现高质量实时重建,提出了一种高效灵活、与图像天然对齐的三维几何表示——傅里叶占有率场(FOF);基于FOF,构建了首个30+FPS高质量实时单彩色相机人体三维重建框架,同时,设计了端到端实时高保真神经渲染方法;进而,基于FOF,设计了基于2D扩散模型的3D生成框架,实现了高质量、高分辨率、高效率、支持宽松衣服与全局视角一致性的3D人体生成,同时支持人体姿态和文本作为条件引导生成过程。此外,本报告还将分享本研究组在大场景群体重建等方面的最新相关研究成果。 |
|
报告人简介:李坤,天津大学智能与计算学部英才教授、博士生导师。主要研究方向为三维视觉,尤其是以人为中心的智能重建与生成。以第一作者/通讯作者在国际知名期刊和会议上发表论文70余篇(多数公布代码与数据),部分研究成果实现了产业化应用。荣获中国图象图形学学会石青云女科学家奖、ICME'17最佳论文奖(获奖率0.8%)等荣誉。主持了国家自然科学基金优秀青年科学基金、天津市杰出青年科学基金、国家重点研发计划青年科学家项目等17 项科研项目。指导的“一键成模——数字世界模型基建轻量供应商”项目荣获2023年中国国际大学生创新大赛总决赛季军、金奖。担任天津市人工智能学会副秘书长、ACM MM 2021大会领域主席、Fundamental Research等国际期刊编委、VALSE 2022大会本地主席等职务。 |
报告题目:三维数字人高效建模技术及其产业落地 |
|
报告摘要:数字人,作为人类在数字化空间中的具象化身,是元宇宙和虚拟现实产业的核心研究领域之一,在影视、传媒、文旅等众多领域具有广泛的应用价值。在学术界,如何高效、高质量地建模超写实三维数字人一直是数字人领域的关键技术问题。本次报告将介绍本人所在实验室在高效数字人建模方面的研究成果,并分享课题组基于这些技术做的一些产业落地。 |
|
报告人简介:郭玉东,中国科学技术大学特任副研究员。2021年博士毕业于中国科学技术大学,后曾于杭州像衍科技公司担任研发总监,期间研发的数字人相关产品已在杭州文广电视台和中央广播电视总台多个栏目得到应用。研究方向为三维视觉与数字人,近年来在相关领域的顶级期刊与会议上发表论文10余篇,曾获得华人数学家联盟最佳论文奖(若琳奖),并多次担任CVPR、ICCV、SIGGRAPH (ASIA)、IJCV、TVCG等期刊会议审稿人。 |
报告题目:风格化数字人的驱动 |
|
报告摘要:3D数字化身的制作往往需要大量时间和成本。随着AIGC技术的逐步成熟,利用该技术加速3D数字化身的生产过程已经成为现实。本项目旨在研发一个风格化的3D聊天头像系统,并探索其在游戏发布素材制作中的应用场景。通过融合前沿的AIGC技术与计算机图形学方法,用户将能够轻松生成个性化且富有独特风格的3D对话头像。本talk将汇报深入探讨风格化3D化身的设计方法与实时动画的实现路径。 | |
报告人简介:潘烨,现任上海交通大学电子信息与电气工程学院副教授、博士生导师,2015年伦敦大学学院获得博士学位,随后分别任职于UCL高级博士后研究员、国洛杉矶迪士尼研究副研究员。因在虚拟角色方面的贡献,分别入选2019年《福布斯中国30位30岁以下(科学)精英榜》, 2020年上海海外高层次人才引进计划,2022年中国图学学会青年人才托举工程,2023年CCF-腾讯犀牛鸟基金优秀项目。在国际顶级会议和期刊发表学术论文40篇(一作及通讯CCF A类21篇),授权美国专利2项。 |
报告题目:面向人物场交互感知的运动捕捉与生成
|
|
报告摘要:运动捕捉和运动生成是构建数字化身、赋能具身智能等应用的基础。目前,通过结合深度学习和大规模数据,现有方法在单目运动捕捉和文本运动生成方面取得一定进展,但其重建和生成的运动在交互合理性方面仍然存在诸多挑战性问题。本报告将介绍面向人物场交互感知的运动捕捉和生成系列方法,通过在神经网络的学习和推理过程中引入交互状态反馈,在保证算法实时性的同时提升运动重建的全局准确性,增强人体和场景、手部与物体的交互合理性。报告还将进一步展望探讨运动捕捉与生成统一的学习框架和未来研究趋势。 | |
报告人简介:张鸿文,北京师范大学人工智能学院副教授。主要从事以人为中心的三维视觉研究,尤其是三维人体的运动捕捉与生成、化身重建与驱动等课题。发表CCF-A类/领域顶刊顶会论文40余篇,其中TPAMI/TOG和CVPR/ICCV/ECCV/SIGGRAPH论文30余篇,顶会口头报告/亮点论文7篇,Google Scholar引用量3000余次,提出的动捕系列算法累计获GitHub星标量超过1200,获中国科学院优博论文/院长奖等荣誉。代表性成果详见个人主页:https://zhanghongwen.cn |
报告题目:数智化虚拟病人构建与应用
|
|
报告摘要:数智化虚拟病人的构建需综合利用虚拟/增强现实、人工智能、人机交互等信息技术,报告将首先介绍相关研究背景,然后,介绍在医学诊疗知识图谱构建、个性化虚拟病人行为智能建模、虚拟标准化病人情境化交互演化仿真等方面的研究进展,最后,结合系列应用系统,介绍数智化虚拟病人在临床诊疗技能练考方面的典型应用。
|
|
报告人简介:李帅,北航计算机学院教授、博士生导师,青年长江学者,长期从事医工交叉研究,在IEEE TPAMI、IEEE TVCG、IJCV、IEEE TIP、AAAI、ICCV、CVPR等领域顶级期刊和会议发表论文120多篇;获授国家发明权专利42项,获批国家标准1项,制定并发布专家智慧诊疗相关的专家共识2项;获2023年中创软件人才奖、2020年中国电子学会科技进步一等奖、2021年中国产学研合作创新成果一等奖、2020年山东省科技进步二等奖、2010年国家科技进步一等奖、2020年中国仿真学会优秀科技工作者等;任中国仿真学会医疗仿真专委会副主任委员、中国解剖学会智慧解剖分会副主任委员、中国工程科技2040发展战略研究技术预见专员、北京市知识产权战略咨询委员会委员、多个期刊编委等;2021年北航优秀博士论文指导教师,2023年、2024年北航优秀硕士论文指导教师。
|
技术论坛5:教育教学 |
---|
论坛召集人:张磊、周元峰 |
---|
论坛讲者:雍俊海,徐岗,龙启铭 |
Panel专家:雍俊海,徐岗,龙启铭,陈发来,冯结青 |
召集人简介:张磊,北京理工大学计算机学院长聘教授,博士生导师,国家优秀青年基金获得者。担任可视媒体计算研究所所长,智能信息技术北京市重点实验室副主任。2004年和2009年分别在浙江大学获得学士和博士学位。研究方向为计算机图形学、图像与视频处理。承担国家重点研发课题、国家优青、面上等项目,在TOG、TVCG、TIP等发表论文六十余篇。出版教材1部,承担北京理工大学研究生精品课程1门。 |
召集人简介:周元峰,山东大学软件学院教授,博士生导师,副院长,山东省数字与数据融合出版传媒重点实验室首席科学家,山东省工业技术研究院“智慧医疗与精准正畸”研究中心主任。中国计算机学会高级会员,中国应用数学学会几何设计与计算专委会委员,CCF CAD&CG专委会委员,中国图学学会可视化与认知计算专委会委员,山东省人工智能学会常务理事。长期从事智能图形图像处理、几何建模与优化、计算医学、人工智能相关研究工作。近五年发表ACM/IEEE汇刊文章20篇,获得CCF A类会议2024年IEEE VR最佳论文奖。以第一完成人身份获得2022年山东省科技进步二等奖1项,获得2020年度陆增镛CAD&CG高科技奖二等奖,泉城产业领军人才。主持山东省教育教学改革项目重点项目1项,山东大学教育教学改革项目重点项目1项,获得国家级教学成果奖二等奖1项,山东省教学成果奖二等奖1项。
|
报告题目:人工智能时代的教学思考 |
|
报告摘要:人工智能近年来发展势头很猛,目前已经成为全社会的热点,对教学也产生了深远的影响。本次报告主要围绕在人工智能时代下的教学展开讨论。首先,介绍人工智能对教学的好处和坏处。然后,结合自身的经历,讲解应对人工智能冲击的两种可能方式。第一种方式是向纵深发展,希望能够超过人工智能向纵深发展的速度。第二种方式是另辟蹊径,建立培养原创性人才的教学模式,引领人工智能的发展。另外,本次报告还介绍了一个令报告人震惊的教学案例。最后,还简要介绍报告人编写过的部分书。抛砖引玉,希望对大家有所启发。 |
|
报告人简介:雍俊海教授,博导,清华大学计算机系学士、硕士和博士,美国肯塔基大学博士后。现为清华大学软件学院教授、计算机学会会士、中国工业技术软件化产业联盟CAD专委会副主任和全国高等学校计算机教学与产业实践资源建设专家委员会委员,曾任清华大学软件学院第四届学术委员会主任、计算机学会CAD专委会副主任、多个国际会议程序委员会联合主席和国际期刊《Computers & Graphics》编委。曾获国家杰青、全国优博、国际Elsevier Outstanding Service Award、计算机动画国际会议最佳论文奖、国家级教学成果二等奖、教育部自然科学一等奖、以及清华大学的青年教师教学优秀奖、大学生研究训练计划优秀指导教师一等奖、优秀硕士和博士学位论文指导教师奖等荣誉。在《ACM TOG》和《IEEE T. PAMI》等期刊与会议上发表200多篇学术论文,负责或参与制订17项国家标准,出版《C程序设计》等10多本书,其中《Java程序设计教程》入选国家级规划教材,并获普通高等教育精品教材和首届中国大学出版社图书奖一等奖等多个奖励。个人科研科普专著《清华教授的小课堂:魔方真好玩》,不仅生动有趣,还减少了入门级复原魔方所需的转动次数,并入选了由教育部发布的全国中小学图书馆(室)推荐书目。 |
报告题目:创新实践驱动的图形学与工业软件人才培养模式探索 |
|
报告摘要:本报告将介绍杭电计算机学院在计算机图形学人才与设计仿真类工业软件人才培养方面的模式创新与探索,即以创新实践驱动,实现全学段、递进式实习实践,辅以多层次、全过程产教融合,以“赛”促学,以“研”促学,培养“厚基础、重实践、强能力、深探究、接前沿、拓视野”的图形学与工业软件人才。 |
|
报告人简介:徐岗,杭州电子科技大学计算机学院副院长,教授,博士生导师,中国计算机学会杰出会员,担任计算机国家级实验教学示范中心主任。研究兴趣包括计算几何、网格生成、等几何分析、工业软件平台研发等。以负责人身份主持在研或完成国家重点研发计划课题2项(其中千万级课题1项)、国家自然科学基金项目7项(包括重点类项目2项),主持国家数值风洞重大工程课题、装发共用信息系统课题、浙江省重点研发计划等重要科研项目多项。担任GDC 2022 程序委员会共同主席、CCF 计算机辅助设计与图形学专委会常务委员、《计算机辅助设计与图形学学报》编委及《图学学报》编委. 近年来承担了《工业软件导论》、《计算机图形学》、《数字几何处理与仿真》、《智能可视建模与仿真-科研实践》等本科及研究生课程,培养硕士/博士毕业生80余名,曾指导博士生获全国CAD&CG优秀学生奖、GDC最佳论文奖,曾获杭州电子科技大学教学成果奖一等奖(第一完成人)。 |
报告题目:智能时代的新形态教材建设 |
|
报告摘要:在移动互联网时代,特别是人工智能与大模型技术的应用发展,如何建设“好”教材,让教材适应智能时代的发展,融合微视频、智能体等多元素的新形态教材是关键。 | |
报告人简介:龙启铭,清华大学出版社首席策划,编审,主要从事计算机图书的策划和出版,策划和出版了《计算机网络》《人工智能:一种现代的方法》等优秀教材书。 |
专家简介:陈发来,中国科学技术大学数学系教授、博士生导师,曾担任中国工业应用数学学会常务理事(2004-2016),中国工业应用数学学会几何设计与计算专委会主任(2015-1019),安徽省数学会秘书长(2003-2019),安徽省工业与应用数学学会理事长(2023--),国务院学位委员会数学学科评审组成员(2009-2019),教育部高等学校数学与统计学教学指导委员会委员(2006-2023),《Computer Aided Geometric Design》(2005--),《Visual Computer》(2008—2022),《Journal of Computational Mathematics》(2024--),《计算机辅助设计与图形学学报》等期刊编委。曾获教育部高校青年教师奖,国家自然科学基金杰出青年基金,宝钢优秀教师奖特等奖,中国计算机图形学杰出奖,冯康科学计算奖,国际几何设计领域最高奖John A. Gregory Memorial Award,全国百篇优博论文指导教师奖,中组部“万人计划”教学名师等。研究方向为计算机辅助几何设计与几何建模。近来感兴趣的研究课题包括:曲面隐式化的动曲面方法,几何内核关键算法如曲面求交, T网格上的样条曲面,等几何分析及其在拓扑优化中的应用, 基于稀疏优化的几何处理等。
|
专家简介:冯结青,浙江大学计算机辅助设计与图形系统全国重点实验室教授,博士生导师。1992年毕业于国防科技大学应用数学专业,获工学学士学位;1997年毕业于浙江大学应用数学系,获理学博士学位。研究方向包括计算机辅助几何设计、基于视觉的三维人体建模、塔式太阳能系统建模、仿真和优化等。在研究生教学方面,一直开展《计算机图形学》、《应用几何造型基础》等课程的教学。
|
技术论坛6:国产虚拟现实引擎与系统 |
---|
论坛主席:李胜、张松海 |
---|
论坛讲者:周忠,王琥,王锐,盖孟,朱飞,唐兴波,张亚辉 |
论坛主席简介:李胜,北京大学研究员,研究方向为计算机图形学、虚拟/增强现实,担任国家级重点实验室副主任。长期致力于国产化虚拟现实软件及应用系统的研发,系统在国防领域获得良好的推广和应用。在包含ACM TOG、Siggraph/Asia、IEEE TVCG、IEEE VR等期刊/会议发表论文100余篇,科技发明专利50余项。所研发的国产化系统曾获得2022年中国计算机学会(CCF)技术发明一等奖、教育部科技进步一等奖、教育部科技进步二等奖、中国图像图形学会科学技术奖二等奖等5项省部级奖励。担任中国计算机学会计算机虚拟现实与可视化专委常务委员、CAD与图形学专委委员。 |
论坛主席简介:张松海,清华大学计算机系长聘副教授,主要从事虚拟现实与计算机图形学、图像/视频处理、可视化等方面的教学和科研工作,在三维内容生成、三维场景合成、VR交互等方面提出了一系列创新成果,近五年在IEEE TVCG、IEEE TIP、IEEE TMM等国际期刊和ACM SIGGRAPH、IEEE CVPR、ECCV、IEEE VR、ISMAR等国际会议上发表论文40余篇,获国家科技进步二等奖1项(2018,排名第三)。
|
报告题目:MR地图引擎实践与思考 |
|
报告摘要:随着虚拟现实技术的发展和应用扩展,虚拟现实基础引擎正变得越来越庞大和复杂,其研发需要长期持续积累和新技术的引入,同时还需要关注对共性需求问题的解决。报告介绍了项目组研发的MR地图引擎,结合引擎研发演进过程,对相关技术和需求理解进行解析,最后分享对国产化虚拟现实引擎的一些思考。 |
|
报告人简介:周忠,教授,博士生导师,国家级领军人才,虚拟现实/增强现实技术及应用国家工程实验室(北京航空航天大学)副主任、国家重点研发计划项目首席科学家、中国虚拟现实技术与产业创新平台CVRVT公共安全专委主任。长期从事虚拟现实/增强现实/混合现实与人工智能等方面的研究工作,在IEEE TPAMI、TIP、TITS等国际期刊和VR、ICCV等国际会议上发表论文100多篇,获国家发明专利授权七十多项,出版专著1部。相关研究工作形成了多套引擎工具或装置,在分布仿真、影视制作、智慧城市等领域得到重要应用,获国家科技进步二等奖、国家技术发明二等奖各1项。 |
报告题目:面向复杂产品的CAD/CAE一体化设计关键技术 |
|
报告摘要:国内目前尚没有形成真正形成面向CAD/CAE一体化的设计能力。为了打破国外商业软件在设计领域的垄断,针对目前商业软件的短板,本次报告从模型一体化能力、样本生成效率、建模和优化能力不同角度对CAD/CAE一体化设计展开分析,力图以行业应用为切入点、自主开发面向复杂产品的多学科智能优化设计平台,使其具备大规模计算能力,整合不同层次的关键技术,以较低的使用和学习成本赋能行业中的特定工程实际问题。 |
|
报告人简介:王琥,湖南大学教授,博士生导师,湖南迈曦软件有限责任公司联合创始人,教育部新世纪人才,岳麓学者。
主要从事CAD/CAE一体化快速计算方法,智能结构优化方法、参数反求理论以及高性能计算等相关研究及软件开发工作。获教育部科技进步一等奖,机械工业部科技进步二等奖。主持国家重点研发计划课题,863重点项目课题,国家自然科学基金,湖南省自然科学基金重点项目多项,出版专著1部,发表SCI论文100余篇,引用2000余次,获Emarld出版社杰出论文奖,授权发明专利10余项,软件著作权20余项。 |
报告题目:实时云渲染引擎技术与解决方案 |
|
报告摘要:近年来,4K/8K高清显示设备与VR头盔、智能手机的快速普及,使人们拥有了体验高质量虚拟环境的视觉硬件装置。然而,在软件方面,当前的渲染方法与系统依然面临着过分依赖终端GPU、计算/能耗资源消耗过大等问题,严重制约图形渲染应用的发展。本报告将介绍一款云原生的实时渲染引擎RaysEngine,通过依托云计算技术,尝试解决上述渲染应用中面临的问题,并进一步介绍基于云原生引擎所研发/开发的一系列渲染工具与行业解决方案。 | |
报告人简介:王锐,浙江大学教授、博士生导师,光线云公司联合创始人。
主要研究方向为图形渲染理论、算法与框架,在复杂光场高效采样、实时绘制算法、自动优化框架等方面取得了一系列国际领先的成果,发表学术论文八十余篇(其中自然子刊、ACM TOG、SIGGRAPH等顶会/顶刊论文三十余篇),授权国内外专利四十余项。担任SIGGRAPH、EG等国际会议程序委员会委员,多个国际期刊编委。承担十余项国家纵向课题,所研发的技术与产品已成功应用于国内多家头部的互联网公司。曾获教育部科技进步一等奖、浙江省技术发明一等奖。 |
报告题目:国产图形引擎在视景仿真领域的应用 |
|
报告摘要:现实世界的数字化、以及数字化世界的逼真再现,是当前各行各业正在发生的深刻技术变革。图形渲染与虚拟仿真技术在时代发展的浪潮中扮演了核心角色。计算机图形学在诞生之初就被应用于视景仿真领域,特别是飞行模拟视景系统对专业飞行员的培训起到了重要作用。本报告回顾了模拟器视景成像系统的发展历程,介绍了国产自研图形引擎ViWo的系统架构和技术特性,对比了视景系统与一般游戏引擎相比的差异和挑战,并对视景仿真领域与前沿技术的融合发展进行了展望。
|
|
报告人简介:盖孟,北京大学研究员/北京微视威技术有限公司联合创始人
2016年毕业于北京大学获理学博士学位。现为北京大学计算机学院研究员,从事计算机图形学、虚拟现实等方向的研究。
曾参加国家重点基础研究发展计划(973计划)、国家自然科学基金等重大科研项目。作为核心开发人员参与研发特征驱动的三维离散造型系统PUM、大规模场景虚拟仿真支撑平台ViWo。长期从事国产化视景仿真系统的研究,作为系统架构师和核心研发人员,研发了国内首个通过民航局5级训练器鉴定的纯国产自研视景成像系统,在多种机型的专业飞行模拟器上获得使用。现为中国指挥与控制学会、中国图学学会、中国图象图形学学会、北京安防协会、中国航空学会会员。 |
报告题目:面向云端CAD/CAE系统的可视化引擎 |
|
报告摘要:近年来,CAD/CAE等工业软件的云化成为大趋势。系统的云化带来了一系列优势:“开箱即用”的使用体验,免去了繁琐的安装、升级、维护等工作;云端算力的弹性扩充极大提升了硬件资源的利用率,降低使用成本;基于云端软件架构可实现多人在线协同,突破流程孤岛,提高工作效率。但是,软件的云端迁移也带来了新的研发挑战。针对三维数据在Web端的高性能渲染及可视化的技术难题,本报告将介绍团队自主研发的国产可视化引擎的功能特性与关键技术。 | |
报告人简介:朱飞,北京大学博士、助理研究员,北京云境智仿信息技术有限公司CEO。
长期从事计算机图形学、物理仿真、GPU并行计算、深度学习等技术的前沿研究与工程化落地。作为技术骨干或子专题负责人参与国家重点研发计划、科技委重点课题等多项重大项目,在国际高水平期刊及会议发表论文多篇,申请/授权国家发明专利十余项,获中国计算机学会技术发明一等奖等奖项。作为技术负责人参与多个产品的0到1研发过程,对前沿技术的产品应用有丰富的经验。 |
报告题目:国产实时3D图形图像引擎在构建数字世界中的创新应用 |
|
报告摘要:随着数字经济不断发展,数字技术与实体经济深度融合,为数字技术应用孕育了大量新场景、新业态和新模式。本报告将介绍艾迪普基于自主研发实时3D图形图像引擎,打造了新一代数字内容生产全链路工具集,并与数字资产平台协同创作的全新工作流,实现从数字内容生产协作到数字资产管理、版权保护等方面的一站式服务,并分享其在云端协同、AI智能等技术方面的优势和应用。
|
|
报告人简介:唐兴波,艾迪普科技股份有限公司创始人、首席技术架构师
主要研究方向为国产3D图形图像实时渲染、跟踪、识别、处理引擎、零代码创作工具及数字资产管理平台。公司自成立20年来带领团队以数字内容产业为依托,结合云计算、大数据、人工智能、区块链等多项前沿技术,构建了数字内容产业全链路闭环体系,广泛应用于虚拟现实、增强现实、虚拟仿真、数字孪生及元宇宙等应用领域的产业化。曾参与多项国家核心技术攻关项目与课题。 |
报告题目:国产化工业数字孪生引擎UGS |
|
报告摘要:国产化工业数字孪生引擎UGS(Universal Graphics System)是广联达自主研发的国产化工业级图形渲染系统,历经十余年的发展,服务建筑行业36+万企业用户,1000+万终端客户,是一款具有高视效、高性能的工业级国产化图形渲染系统,其大规模场景渲染性能获得科技成果评价“国际领先”水平。 | |
报告人简介:张亚辉,广联达科技股份有限公司显示技术部总经理。负责集团核心底层图形引擎系统建设,支持企业重点平台及产品上市与推广,长期从事技术研发和管理工作;在图形学、BIM/CIM技术、企业大型软件、国家课题申报与管理等底层核心技术和大型平台研发管理方面拥有丰富经验;多次作为企业嘉宾参与CADCG、Chinagraph等国内学术会议演讲、交流。 |
技术论坛7:AIGC时代三维内容生成新进展 |
---|
论坛召集人:高林 |
---|
论坛讲者:郭建伟,王鹏帅,王鑫涛,王泽宇,许岚 |
召集人简介:高林,中国科学院计算技术研究所泛在计算系统研究中心副主任,研究员,博士生导师,国科大岗位教授。研究方向为计算机图形学、三维计算机视觉。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文100余篇,研发的人脸AIGC的APP被全球180余个国家或者地区的用户所使用。现任或者曾任GDC 2024大会联合程序主席,SGP 2023大会联合主席,China 3DV 2023程序委员会联合主席,SIGGRAPH 2023-2024技术论文程序委员会委员,NeurIPS 2024领域主席,IEEE TVCG编委,CSIG智能图形专委秘书长,入选国家自然科学基金委优青,北京市杰青,英国皇家学会牛顿高级学者,曾获得亚洲图形学会青年学者奖,吴文俊人工智能优秀青年奖,CCF技术发明一等奖,CCF CAD&CG开源软件奖等奖励。 |
报告题目:基于草图特征建模操作的CAD智能重建
|
|
报告摘要:从原始几何数据进行逆向三维模型的重建是构建数字孪生虚拟环境的重要手段,也是一个经典但困难的研究问题。报告将介绍本团队近期在无监督CAD重建方面的研究成果,首先从现代 CAD 软件常用的草图特征建模语言中汲取灵感,从整体三维形状中学习CAD基元的隐式二维草图(sketch)和拉伸(Extrude)参数,通过拉伸和布尔运算逼近目标几何形状;进一步对该技术进行扩展,无监督地学习一种草图+路径参数化表示方法,支持扫掠(sweep)、放样(loft)和旋转(revolve)等操作,实现了形状细节与结构之间的解耦,不仅增强了模型的可解释性,还提高了输出结果的可编辑性,使用户能够方便地编辑形状的几何和结构特征。
|
|
报告人简介:郭建伟,现为中国科学院自动化研究所多模态人工智能系统全国重点实验室副研究员,中科院青年创新促进会会员。主要研究方向为计算机图形学、几何处理与三维视觉。迄今已在高水平期刊或会议发表论文60余篇,其中ACM SIGGRAPH、IEEE TPAMI、IEEE TVCG等CCF-A类与中科院一区Trans汇刊论文27篇(一作/通讯18篇),授权发明专利17项,成果转化212万元。主持国家自然科学基金项目及省部级科研课题8项,作为核心骨干参与多项国自然重点项目、科技部重点研发计划,主持企业委托项目9项,研究成果成功应用于工业产品三维建模仿真、人-物-场三维数字孪生构建、建筑户型布局结构分析等领域。曾荣获10项学术奖励,包括中国体视学学会青年科学技术奖、中国仿真学会优秀博士论文奖、CVMJ期刊年度最佳论文奖、陆增镛CAD&CG高科技二等奖、CCF-腾讯犀牛鸟科研基金优秀奖等。担任国际权威SCI期刊The Visual Computer、IET Image Processing编委及VCIBA期刊青年编委。
|
报告题目:高效、轻量的三维扩散模型 |
|
报告摘要:扩散模型在三维生成领域取得了显著成效。然而,训练三维扩散模型往往需要庞大的计算资源,某些方法甚至要求动用包含几十乃至上百个GPU的集群。在本次报告中,我将分享我们在开发高效、轻量级三维扩散模型方面的一些研究成果。我们的方法仅需4个NVIDIA 4090 GPU即可进行训练,并在训练完成后,能够在单个NVIDIA 4090 GPU上以2.5秒的速度生成512分辨率的高精度三维模型,同时确保生成的模型具备连续的流形曲面特性。我们方法的核心是基于八叉树结构的多尺度隐式扩散模型。通过在ShapeNet和Objaverse数据集上的验证,我们证明了该方法的有效性。此外,我们还在三维颜色纹理生成以及基于文本提示、草图或类别标签生成高质量3D形状的任务中,展示了该方法的扩展性和灵活性。 |
|
报告人简介:王鹏帅,现任北京大学助理教授,于2013年和2018年分别于清华大学获得本科学位和博士学位。研究方向为计算机图形学、几何处理和三维深度学习。在学术会议SIGGRAPH(ASIA)、CVPR等上发表多篇论文,其中基于八叉树的的三维稀疏卷积的论文在2017年至2022年所有发表在SIGGRAPH (Asia) 和 ACM TOG的论文中引用量排名前5。王鹏帅博士担任著名图形学期刊Computers & Graphics的副主编、著名图形学国际会议(如SIGGRAPH Asia 2024、Eurographics 2024、CVM 2023/2024等)的会议程序委员。王鹏帅博士于2022年至2024年连续三年获得AMiner评选的AI 2000 最有影响力的学者称号,并于2023年获得亚洲图形学学会 (Asiagraphics) 青年学者奖。 |
报告题目:探索3D可控的视频生成 |
|
报告摘要:随着Sora、可灵、Gen3等视频生成模型的相继出现,视频生成技术的逼真度不断提升,这为内容创作带来了革命性的变化。然而,在追求高质量生成效果的同时,如何实现对生成内容的精确控制也成为一项关键挑战。在本报告中,我们将介绍3D可控视频生成领域的最新技术进展,以及分享快手视觉生成与互动中心在该领域的一些探索工作。 | |
报告人简介:王鑫涛,快手专家研究员。本科毕业于浙江大学,博士毕业于香港中文大学 MMLab。目前主要研究视觉生成,包括图像、视频和 3D 的生成与编辑。在国际顶级会议期刊发表多篇文章,论文 Google Scholar 引用 15400 余次,被评选为世界前2%顶尖科学家。 |
报告题目:利用网格表示的高保真可编辑三维数字人
|
|
报告摘要:NeRF和3DGS等表示在三维重建、内容生成和神经渲染等领域中获得了广泛应用,然而三维网格作为计算机图形学的传统表示,在兼容渲染管线、方便用户编辑等方面仍具有重要优势。本报告将介绍利用网格表示的高保真可编辑三维数字人方法。SplattingAvatar将GS嵌入到三角网格中,通过网格表示低频运动和表面变形,通过GS表示高频几何和外观细节,实现了高保真度、实时渲染的全身三维数字人。HeadEvolver利用局部可学习的网格变形场和二维扩散先验,能够根据文本描述生成风格化的三维头像,并且可以保持三维属性进行无缝编辑。实验表明,相关方法可以生成真实感强、表现力丰富的三维数字人,同时支持艺术家在图形软件中直观编辑,从而更好地促进数字资产创作和三维动画等下游应用。 | |
报告人简介:王泽宇,香港科技大学(广州)信息枢纽计算媒体与艺术学域、人工智能学域助理教授,香港科技大学新兴跨学科领域学部、计算机科学与工程系联署助理教授,创意智能协同实验室负责人。于耶鲁大学计算机科学系获得博士学位,师从Julie Dorsey和Holly Rushmeier教授;于北京大学智能科学系获得荣誉学士学位,师从查红彬和池内克史教授。研究方向为计算机图形学、人机交互、人工智能、数字文化遗产,已在包括TOG, SIGGRAPH, CHI, CVPR在内的重要国际期刊和会议上发表30余篇学术论文。担任Eurographics, SIGGRAPH Asia (Courses, Technical Communications, Posters) 程序委员,中国计算机学会计算机辅助设计与图形学专委会执委、中国图象图形学学会三维视觉专委会委员、GAMES执委。担任TOG, TVCG, TPAMI, SIGGRAPH, CHI, VR, CGF, EG, PG等国际期刊和会议审稿人。入选国家级高层次人才计划青年项目、CCF-腾讯犀牛鸟基金、Adobe研究基金,并获得最佳论文奖、多项最佳提名奖等荣誉。 |
报告题目:三维内容生成的一些思考
|
|
报告摘要:生成式深度学习和神经表示技术的发展,为高质量的动静态场景重建、渲染和生成都带来新突破。并且进一步随着5G网络、虚拟数字人、元宇宙等应用场景的蓄势待发,其需求也变得越发迫切。本次报告结合过去一年课题组在以人为中心的动静态内容生成方面的科研进展,重点探讨三维生成技术的发展,并且展望未来体积视频渲染和生成相结合的发展方向。
|
|
报告人简介:许岚博士,上海科技大学信息科学与技术学院助理教授、研究员、博士生导师,MARS实验室主任。他的研究方向聚焦于计算机视觉、计算机图形学和计算摄像学,致力于光场智能重建理论与技术的研究,突破了动态神经辐照场和虚拟数字人的一批核心关键技术,率团队研制了系列光场装置,的超写实数字人提供了新范式。他在CVPR、SIGGRAPH、IEEE TPAMI等顶级刊物发表数十篇文章,并多次担任人工智能顶级会议CVPR、ICCV、AAAI等领域主席。
|
技术论坛8:图像视频智能生成 |
---|
论坛召集人:连宙辉 |
---|
论坛讲者:马利庄、朱军、朱思语、陶鑫、元玉慧 |
召集人简介:连宙辉,北京大学王选计算机研究所副教授、博士生导师,北京大学博雅青年学者,中国文字字体设计与研究中心副主任,入选国家级青年人才计划和北京市科技新星计划。研究领域为计算机图形学、计算机视觉与人工智能,主要研究方向是图形图像生成及其应用,在领域重要期刊(TOG, TPAMI, IJCV等)和会议(SIGGRAPH/SIGGRAPH Asia, CVPR, NeurIPS等)上发表论文90余篇。多次担任NeurIPS、CVPR、ICCV等国际会议领域主席,担任《Pattern Recognition》、《计算机辅助设计与图形学学报》等国内外重要期刊编委,获北京市技术发明奖二等奖(排名1)、中国专利优秀奖(排名1)、吴文俊人工智能优秀青年奖等奖励。 |
报告题目:三维场景感知理解与细粒度生成技术
|
|
报告摘要:三维场景理解与重建技术是增强现实、智能机器人、自动驾驶、空间智能等重大应用领域的关键技术,旨在让机器像人类一样通过三维空间的思维环境来理解场景,并参与到真实世界的规划、生产以及生活娱乐之中。本报告将从计算机视觉与三维生成的角度,归纳总结现有的扫描场景点云特征匹配融合的系列方法,对前沿的三维场景理解与分析技术进行细致的梳理,并回顾目前针对三维物体点云补全技术、三维内容生成技术的发展脉络,介绍团队在相关领域的最新进展,推动核心技术在自动驾驶、具身智能等领域的应用。本报告对目前的技术挑战进行探讨并展望未来发展趋势。
|
|
报告人简介:马利庄,上海交通大学特聘教授,人工智能研究院副院长,华东师范大学特聘教授。中国图象图形学会理事、会士、数字娱乐与智能生成专委会主任,计算机学会CAD&CG专委会副主任,人工智能学会理事。马教授是国家杰出青年基金(1996),上海市科技进步特等奖(第一完成人)、一等奖、二等奖,中国青年科技奖,国家教育部科技进步二等奖,吴文俊人工智能自然科学奖一等奖;国家“百千万人才工程”(国家级)首批人选(1997);国务院特殊津贴获得者。马教授在国内外重要学术刊物上发表论文500多篇,包括一系列IEEE TPAMI、TIP、CVPR等顶级论文,在跨媒体智能处理、人体姿态估计、3D场景分析与理解等方向取得一系列创新性成果。 其中与腾讯优图等合作,核心技术开发的健康码覆盖14亿用户,在金融支付、寻人打拐方面取得重大社会效益和经济效益114亿元;与宁德时代、腾讯科技等合作提出亚微米级工业视觉智能检测技术,新增营收891亿元,相关系统设备出口德、日、美。 |
报告题目:Vidu视频大模型创新及应用
|
|
报告摘要:Vidu于4月27日正式发布,是首个全面对标Sora的视频大模型,能够高效生成高一致性、强动态性、符合物理规律的视频片段。Vidu是构建在团队提出的首个将扩散模型与Transformer融合的架构U-ViT之上。本报告将介绍Vidu视频大模型的底层技术原理、以及基于Vidu的视频创作等最新进展。Vidu的在线版本:https://www.vidu.studio/
|
|
报告人简介:朱军,清华大学计算机系博世人工智能冠名教授、AAAI/IEEE Fellow、清华大学人工智能研究院副院长、计算机系人智实验室主任,曾任卡内基梅隆大学兼职教授。主要从事机器学习研究,发表CCF A类会议/期刊论文百余篇,谷歌学术引用2.5万余次;担任国际著名期刊IEEE TPAMI的副主编,担任ICML、NeurIPS、ICLR等(资深)领域主席20余次;曾获中国科协求是杰出青年奖、科学探索奖、中国计算机学会自然科学一等奖、吴文俊人工智能自然科学一等奖、ICLR国际会议杰出论文奖等,入选国家级高层次人才计划、中国计算机学会青年科学家、MIT TR35中国先锋者、IEEE AI 10 to Watch等。
|
报告题目:基于三维物理约束的人像视频生成模型 |
|
报告摘要:本次讲座将聚焦于视觉生成模型在模拟真实物理世界过程中的挑战与机遇。我们将首先回顾视觉生成模型的发展历程,尤其是近年来基于扩散模型的显著进展,例如Sora模型在视频生成领域的突破。其次,本讲座将深入探讨模拟真实物理世界的关键要素,包括外观、几何、光照、运动和声音等,并分析当前模型在这些领域面临的挑战。随后,我们将详述现有视频生成模型在模拟物理世界方面的局限性,及我们团队通过引入确定性条件提高模型精度和效率的方法。特别是,我们将在讲座中着重展示在模拟人脸、人体和半身像等场景中的相关研究工作。最后,讲座将展望未来的研究方向,讨论如何结合确定性条件与概率扩散模型以实现更逼真且可控的人像视觉生成。 |
|
报告人简介:朱思语,复旦大学人工智能创新与产业研究院研究员,长聘正教授及博士生导师。本科毕业于浙江大学,博士毕业于香港科技大学。在博士期间,他联合创立了3D视觉公司Alituzre,后被苹果公司收购。2017年至2023年,他担任阿里云人工智能实验室总监。自2023年起,他加入复旦大学,专注于视频和三维生成式模型的研究,涵盖视觉基础的三维与视频重建、生成和理解。他已在CVPR、ICCV、ECCV、PAMI等国际会议和期刊上发表论文60余篇。此外,他主持了多个影响力较大的开源项目,包括人脸视频生成模型Hallo、人体视频生成模型Champ、视频动画生成模型AnimateAnything等。 |
报告题目:可灵视频生成技术的探索与挑战 |
|
报告摘要:视频生成技术作为生成式AI的前沿领域,正吸引着学术界与工业界的广泛关注。随着可灵平台的推出以及近期多家商用平台和开源项目的发布,视频生成技术正在快速发展,并在多个应用场景中展现出巨大潜力。本报告将介绍可灵平台的核心能力及其最新进展,同时会分享可灵技术团队近期在学术领域的研究工作。此外,还将探讨研发过程中遇到的技术挑战,并展望未来的发展趋势。 |
|
报告人简介:陶鑫,快手视觉生成与互动中心专家研究员,目前负责可灵(Kling)视频生成模型算法研发工作。2018年博士毕业于香港中文大学,师从贾佳亚教授,随后任职于腾讯优图X-Lab。自2020年加入快手以来,他负责研发和工业落地多项编辑和生成算法能力;参与搭建电商场景下大规模商用的直播写实数字人平台“快手智播”;2024年6月发布首个可体验的类Sora视频生成模型。研究领域主要集中在图像视频增强与生成方面,发表顶会论文30余篇,谷歌学术引用4500+。 |
报告题目:Biz-V:面向商业内容的生成模型技术 |
|
报告摘要:平面设计是一种视觉传播技术,通过结合文本和图形,以明确的目标向特定用户传达信息。在商业内容创作中,平面设计同样至关重要,例如用于制作海报、幻灯片和信息图表。在本次报告中,我们将重点介绍我们在构建图形设计生成引擎方面所做的持续努力,这些引擎能够生成高质量的商业内容。我们不仅提出了一种新颖的方法(Glyph-ByT5)来支持极为精确的视觉文本渲染,还开发了一种高效的后期训练方案(Step-aware Preference Optimization),以提升视觉美感。通过整合这些技术,我们实现了高质量的图形设计图像生成效果。此外,我们还将分享在探索下一代支持变分辨率、变层数的多图层图像生成方面的最新进展和探索成果。
|
|
报告人简介:元玉慧,微软亚洲研究院视觉计算组高级研究员。他于2022年、2017年和2014年分别获得中国科学院计算技术研究所、北京大学和南京大学的博士、硕士和学士学位。现在,他主要从事两个方向的工作:(1)开发生成式人工智能技术,以支持多种产品在Microsoft Designer上的应用;(2)开发下一代平面设计生成引擎,用于高质量的商业内容生成(例如海报、传单、信息图表、图解、图表和幻灯片)。他最近的代表性工作包括:LISA,用于推理分割(CVPR 2024),COLE,用于多层次和可编辑的图形设计生成,Glyph-ByT5,用于精准的视觉文本渲染,以及SPO,用于扩散模型的后训练。自2017年加入微软亚洲研究院以来,他在通用视觉语义/实例/全景分割和目标识别等领域拥有丰富的经验。他在分割和目标检测领域的代表性工作包括OCRNet(ECCV 2020)、OCNet(IJCV 2021)和H-DETR(CVPR 2023)。 |
技术论坛9:工业软件与图形学的“双向奔赴” |
---|
论坛召集人:徐岗 |
---|
论坛讲者:何均宏、赵峰、刘杨、周帅、张维声、袁春明、马丽 |
召集人简介:徐岗,杭州电子科技大学计算机学院教授,博士生导师,副院长,中国计算机学会杰出会员,担任计算机国家级实验教学示范中心主任、浙江省离散行业工业互联网重点实验室副主任。研究兴趣包括计算几何、网格生成、等几何分析、工业软件平台研发等。在CMAME、CAD、CAGD、TIP、CVPR、IJCAI、计算机学报、软件学报等国内外重要会议及期刊发表论文近百篇,相关工作被SCI他引1000余次。曾获得全国首届“几何设计与计算”青年学者奖,入选浙江省杰青,浙江省“万人计划”及浙江省首批高校创新领军人才。以负责人身份主持在研或完成国家重点研发计划课题2项(其中千万级课题1项)、国家自然科学基金项目7项(包括重点类项目2项),主持国家数值风洞重大工程课题、装发共用信息系统课题、浙江省重点研发计划等重要科研项目多项。担任GDC 2022 程序委员会共同主席、CCF 计算机辅助设计与图形学专委会常务委员、《计算机辅助设计与图形学学报》编委及《图学学报》编委. |
报告题目:open3DX--一站式云智造创意设计工艺与制造平台
|
|
报告摘要:支持高等院校教学与实训、创意设计及制造企业创新发展,介绍一站式云智造创意设计工艺与制造平台,包括:1、基于精准扫描及摄像,重建产品模型CAD设计表示,在缺少设计图纸的条件下对产品进行参数化重建;2、对零件模型进行可制造性分析、制造特征识别,大规模生产中进行工艺重用和规划;3、探索基于语音、文本或草图的CAD多模态设计交互,二维草图、几何约束和三维实体模型的生成式构建;4、加工特征智能识别与工艺设计,探索CAD模型的智能生成、智能编辑、智能交互以及智能加工技术;5、与业界共建一站式创意-设计-制造的云智造教学实训与创新平台。
|
|
报告人简介:何均宏,open3DX工作委员会主席,工业软件工作委员会联合主席,2012Lab技术战略顾问。历任欧盟IST Research Director,2012Lab研究总监、智能计算总监。CAD&CG专委会执委;中国工业与应用数学学会GDC执委。从事三维几何建模、约束求解引擎、永久命名系统等核心几何引擎研发,三维零件生成式设计与制造、三维设计教学实训创新平台、一站式云智造CAD/CAE/CAM研究等工作。15项中国、美国技术专利发明人;2016年中国国家技术发明奖获得者;2017年中国公安部技术创新奖获得者;2018年世界博览会(Barcelona)特别创新奖获得者。 |
报告题目:CAE软件创新超越的战略路径
|
|
报告摘要:CAE软件是数学、计算机科学和应用领域工程技术的综合性复杂系统,是当前举国共识的需要突破的自立自强科技方向。报告从软件开发与应用的二元特性出发,主动契合新一代信息技术的赋能,创新拓展了软件新内涵,提出了CAE软件的研发新模式及相应的关键技术族,可望为推动我国CAE软件的创新超越发展提供参考。
|
|
报告人简介:赵峰,中国船舶科学研究中心研究员、博士生导师,原首席专家,国家某重大工程主题首席科学家。长期从事船舶与海洋工程水动力性能、船舶计算流体力学及试验技术、船舶总体性能CAE软件研发等研究工作。先后承担“八五”~“十四五”的多渠道、多项国家级科研项目,获省部级科技进步奖9项,发表论文百余篇,获原船舶重工集团公司突出贡献专家称号、现中船集团学科带头人。
|
报告题目:国家数值风洞工程网格生成软件NNW-GridStar最新进展 |
|
报告摘要: 本报告旨在探讨国家数值风洞工程网格生成软件NNW-GridStar团队近年来在网格生成技术及产品工程化方面的创新探索。团队以基于虚几何的表面网格自动生成为基础,发展基于共形几何的表面网格重生成技术,实现非结构网格轻交互生成,在网格质量和生成效率上比肩国际主流商业软件。同时,团队还不断挖掘结构网格自动化生成的潜力,结合人工智能前沿技术,致力于研发智能化的网格生成系统,为用户提供更加便捷、智能的网格生成方案。报告还将介绍NNW-GridStar软件的最新版本进展,为用户带来更加卓越的网格生成体验。 |
|
报告人简介:刘杨,中国空气动力研究与发展中心计算空气动力研究所高级工程师、硕士生导师,中国空气动力学会计算空气动力学专业委员会委员、中国工业与应用数学学会几何设计与计算专业委员会委员。主要从事大型计算流体力学(CFD)软件研发工作,主持和参与国家重大科研项目10余项,现为国家数值风洞工程网格生成软件网格之星(NNW-GridStar)负责人,在网格生成、科学计算和计算机图形学等领域发表论文30余篇,获得国家发明专利授权30余项,软件著作权10余项。 |
报告题目:面向下一代工业CAE仿真软件的探索与思考 |
|
报告摘要:工业CAE仿真软件是高端制造经验、理论与数据的工具箱,是推动设计变革、探索新概念构型、预测式研发的重要工具,随着高端制造追求对产品更高的性能与丰富的功能,同时对下一代工业CAE仿真软件提出了更高的要求。本次报告将通过前期软件产品开发经验,阐述下一代工业CAE软件的发展难点与热点,下一代工业CAE仿真软件如何完成与计算机技术、高端制造业的融合发展。
|
|
报告人简介:周帅,中国航空发动机研究院仿真技术研究中心高级工程师,2017年浙江大学流体力学专业毕业,是中国仿真学会CAE专委会委员,是中国科协科技人才奖项评审专家;一直在中国航空发动机研究院从事网格生成与CFD算法研究与软件开发工作,参与多项国家级工业软件相关重点项目;依托相关项目的支持,形成了中国航空发动机研究院自主知识产权的软件“萤火虫”(Fire-Fly),获中国航空发动机研究院特别贡献奖;累计发表论文、专利等20余篇,获中国航空发动机集团科技奖项4项,入选第八届中国科协第八届青年人才托举工程,获中国航发集团青年优秀创新人才。 |
报告题目:生物图形启发下的结构化材料设计与智算加速进化 |
|
报告摘要:仿生结构化材料的设计通常依赖于大量的先验知识,通过复制生物结构的图形,利用其在拓扑结构和形状上的相似性来获得优异的力学性能。然而,由于材料在不同服役条件下的多样性,依赖经验启发和图形复制的仿生材料设计方法缺乏严谨的理论基础,难以实现系统化设计,也缺少数学与力学的驱动,最终导致材料难以在实际条件下表现出理想的力学性能。本研究引入“结构基因”的概念,从生物结构图形出发,借助生成式模型创建力学性能的结构基因库。在此基础上,进行力学性能的提纯、交叉等一系列以结构基因为核心的创新设计。最终,在拓扑优化框架下,结合智算力学的求解方法,实现结构基因在新型工况下的加速仿生进化与力学性能传递,从而使结构化材料不仅满足力学设计要求,还具备创新的力学性能。该研究为先进功能结构、生物启发结构和智能结构的系统化设计提供了一条全新的技术路径。
|
|
报告人简介:张维声,大连理工大学工程力学系教授、博导。国家自然科学基金杰出青年基金获得者、优秀青年基金获得者。目前主要从事结构拓扑优化研究。已在CMAME、IJNME等国际计算力学优秀期刊发表论文80余篇(包括多篇ESI热点、高被引论文),SCI他引4000余次。曾获国家自然科学二等奖、教育部“高等学校科学研究优秀成果奖(自然科学)”一等奖,辽宁省青年科技奖、钱令希计算力学青年奖,获大连市杰出青年科技人才、辽宁省优秀科技工作者、辽宁省 “青年拔尖人才”等称号。 |
报告题目:CAD/CAM/CNC中一些数学问题 |
|
报告摘要:数字化设计制造涵盖CAD/CAM/CNC整个过程,生产链长,所涉及的研究领域十分广泛。本报告介绍整个过程中的若干核心共性数学理论与方法:计算几何,几何设计与分析,图形图像数据处理,路径规划与运动控制,几何机器学习等,其中最为关键的流程就是数理模型的建立、分析与求解。这里将给出课题组在数字化智能加工流程中的一些进展,供交流探讨。
|
|
报告人简介:袁春明,中国科学院数学与系统科学研究院研究员,博士生导师。主要从事数学机械化和数字化设计与智能制造方面的研究,曾获中国科学院卢嘉锡青年人才奖和ACM/SIGSAM 颁发的 “ISSAC 杰出论文奖”。在数学机械化方面,将消元理论的基本方法之一,特征列方法,推广到常差分以及常微分差分混合情形,提出了差分方程的机器证明方法。建立了稀疏微分结式理论,给出了计算结式的首个单指数算法。研究成果发表在国际著名刊物 FoCM,TAMS,JSC等上。在数字化设计与智能制造方面,提出了多种实用约束下的时间最优插补算法,显著提高了数控加工的效率;针对五轴路径规划问题,给出了基于 C 空间的光滑刀路生成方法等。结果发表在相关领域权威期刊TII、RCIM、CAD、JCDE、IJAMT等上。部分数控插补算法嵌入国产高档数控系统,成果入选中国科学院院庆 70 周年展,“基于最优插补算法的‘蓝天数控’高档系统,实现了高档数控系统、核心算法在高端制造领域的自主可控”,并成功于广西玉柴集团的数字化无模铸造精密成型机的升级改造。发表论文 50 余篇,获得国家发明 专利 6 项,国际专利2项。 |
报告题目:柏楚工业软件的技术创新和自动化之旅 |
|
报告摘要:柏楚电子是一家专注工业自动化以及CAX软件的公司,凭借软硬件一体的成套解决方案在激光切割业务上占据着国内龙头的地位,同时海外市场份额也在逐年攀升。我们深耕激光切割行业,实现激光切割控制领域多项突破,掌握核心技术,并实现全流程覆盖;涵盖金属切割成型,机器人智能焊接,精密微加工等多个领域。 在二维三维几何算法、多边形排样算法、几何约束求解器、三维布尔运算、数据交换,数字孪生等工业软件组件上都有稳定的积累和100%自主知识产权。
|
|
报告人简介:马丽,历任上海柏楚电子科技股份有限公司科研平台负责人、科研创新负责人,集团与国内科研机构校企合作课题负责人等。致力于文件逆向分析、碰撞检测、三维布尔运算、平面和三维排样算法以及几何约束求解器等核心组件的开发和推广;在图形学,计算几何以及运筹学等领域上有深厚的积累,同时具备大型研发项目的成熟管理经验。 |
技术论坛10:三维表示新发展 |
---|
论坛召集人:廖依伊 |
---|
论坛讲者:高盛华、陈雪锦、张力、胡文博、薛天帆 |
召集人简介:廖依伊,浙江大学信电学院特聘研究员。2018年获浙江大学博士学位,2018年到2021年在德国马普所从事博士后研究。研究兴趣主要为三维视觉与沉浸式媒体编码。在TPAMI、CVPR、ICCV、NeurIPS等期刊和会议发表文章四十余篇,谷歌学术引用3900余次。获ICRA 2024最佳机器人视觉论文奖,入选2023 百度 AI 华人女性青年学者。担任3DV 2025程序主席,CVPR 2023-2024、NeurIPS 2023领域主席,MPEG国际标准组织INVR专题组组长,IEEE 视频处理与通信技术委员会(VSPC)委员。 |
报告题目:2D Gaussian Splatting for Geometrically Accurate 3D Reconstruction and Its Applications
|
|
报告摘要:3D Gaussian Splatting (3DGS) has recently revolutionized radiance field reconstruction, achieving high quality novel view synthesis and fast rendering speed without baking. However, 3DGS fails to accurately represent surfaces due to the multi-view inconsistent nature of 3D Gaussians. We present 2D Gaussian Splatting (2DGS), a novel approach to model and reconstruct geometrically accurate radiance fields from multi-view images. Our key idea is to collapse the 3D volume into a set of 2D oriented planar Gaussian disks. Unlike 3D Gaussians, 2D Gaussians provide view-consistent geometry while modeling surfaces intrinsically. To accurately recover thin surfaces and achieve stable optimization, we introduce a perspective-accurate 2D splatting process utilizing ray-splat intersection and rasterization. Additionally, we incorporate depth distortion and normal consistency terms to further enhance the quality of the reconstructions. We further extend the 2DGS into different applications, including 4D reconstruction, human reconstruction, and scene editing. Extensive experiments validate the effectiveness of our 2DGS for different tasks.
|
|
报告人简介:Shenghua Gao is an Associate Professor in the Department of Computer Science at the University of Hong Kong. He has been supported by the National Thousand Young Talents Program and the Shanghai Outstanding Academic Leaders Program. His research interests include 3D reconstruction, image and video understanding and generation, 3D generation, AI4Science, etc. He has served as an area chair for over ten top conferences (CVPR, NeurIPS, ICCV, ACM MM, ECCV, etc.) , and a publicity Chair for CVPR 2024. He also served as an associate editor for IEEE TPAMI, TMM, TCSVT, etc.
|
报告题目:几何结构指导的神经重建 |
|
报告摘要:神经辐射场技术和3D Gaussian Splatting技术给场景渲染和重建带来了飞跃式进展。在这种框架下,利用场景或物体的几何结构先验能大幅度提高几何重建和渲染质量,并且结构化的表达对重建模型的再编辑具有重要意义。本报告主要介绍如何利用多相机的几何约束、场景几何结构先验、物体部件运动约束等信息,在基于NERF和3DGS的场景重建提升目标三维重建和视角渲染质量。
|
|
报告人简介:陈雪锦,现为中国科学技术大学信息学院教授,博导。分别于中国科学技术大学获得学士和博士学位。曾于耶鲁大学计算机系从事博士后研究,斯坦福大学、微软亚洲研究院任访问学者。主要研究方向为计算机图形学、三维视觉、脑显微图像分析。在ACM TOG、TMI、ICCV、NeurIPS等期刊/会议上发表学术论文80余篇,曾获CVM期刊最佳论文提名、GDC2022、ICME2024 3DMM Workshop最佳论文、ISBI挑战赛第一名等奖励。多次担任Siggraph Asia、Pacific Graphics等国际会议TPC Member。获国家教学成果二等奖、安徽省教学成果特等奖、中国图象图形学学会“石青云女科学家奖”。
|
报告题目:大规模自动驾驶仿真系统研究
|
|
报告摘要:尽管神经辐射场(NeRF)在三维重建中取得了显著进展,但在处理更广泛和复杂的动态场景时,NeRF仍然面临着高昂的计算成本和重建质量的挑战。这些局限性使得NeRF难以应对需要高精度和实时性的应用场景。为了解决这些问题,本报告提出了两种新的表征方法:四维高斯和四面体网格。首先,针对静态场景,四面体网格技术相比NeRF,不仅具有更快的收敛速度和更高的渲染效率,还能够生成更精准的表面细节;其次,针对动态场景,四维高斯表征能够统一建模时间和空间,显著提高了收敛速度和渲染效率,从而大幅提升实时仿真的效率和视觉质量。这些技术的结合在高精度三维重建和场景生成中发挥了重要作用,尤其是在自动驾驶领域,通过生成连续的时空场景数据,这些方法能够准确捕捉和模拟对象的运动和环境变化,有效应对数据多样性不足和复杂光照条件的挑战,最终提升自动驾驶系统在广泛和多样化场景下重建的效率和准确性。
|
|
报告人简介:张力,复旦大学大数据学院研究员,博士毕业于伦敦玛丽女王大学电子工程与计算机科学系,曾任职于牛津大学工程科学系博士后,剑桥三星人工智能中心研究科学家。获得国家级高层次青年人才计划、上海海外高层次人才计划、上海科技青年 35 人引领计划(35U35)、世界人工智能大会青年优秀论文奖;发表 IEEE TPAMI、IJCV、NeurIPS 等人工智能国际期刊与会议论文 70 余篇,论文总被引 17000 余次。担任人工智能国际会议 NeurIPS 2023、NeurIPS 2024、CVPR 2023 与 CVPR 2024 领域主席,国际期刊 Pattern Recognition 副编辑。
|
报告题目:神经渲染中的反走样三维表示
|
|
报告摘要:以Neural Radiance Fields (NeRF) 和3D Gaussian Splatting (3DGS)为代表的三维表示在神经渲染方面已经取得了瞩目的成就。但是渲染过程中对连续信号的离散采样导致了走样(aliasing)问题,不仅降低了渲染图像的细节表现能力,也影响了可微渲染的优化过程,阻碍了神经渲染更进一步表达高真实感细节的能力。如果没有良好的三维表示,反走样渲染需要增加成倍的计算量,严重限制了其可用性。在反走样三维表示方面,我们做了一系列的工作,如 Tri-MipRF (ICCV'23), Rip-NeRF (SIGGRAPH'24), Analytic-Splatting (ECCV'24) 等,进一步拓展了NeRF和3DGS的能力边界。本次报告将围绕NeRF和3DGS上反走样三维表示展开。
|
|
报告人简介:胡文博,腾讯AI Lab 研究员,于2022年在香港中文大学获得计算机科学与工程博士学位。研究兴趣位于计算机图形学,视觉,和人工智能的交叉点,近期研究主要集中在3D神经表示,重建,渲染,理解,以及生成。在SIGGRAPH, SIGGRAPH Asia, CVPR, ICCV, ECCV等发表二十余篇论文。所作工作曾获ICCV 2023 Best paper finalist,以及多次口头报告。个人主页:https://wbhu.github.io/
|
报告题目:如何将三维感知和二维拍摄结合
|
|
报告摘要:这个报告我们将讨论相机拍摄过程是如何影响三维重构的。大部分三维重构,无论是传统的multiview stereo还是最新的NeRF和Gaussian Splatting,都非常依赖多视角一致性。但是大多数采集的图片都是经过相机的图像处理流程(ISP),包括亮度色彩色调的调整。这些处理虽然提高了图像质量,但是破坏了三维重构中的一致性假设,最后会使得重构的三维场景出现漂浮物一般的伪影。为了解决这一问题,我们就需要在重构的过程也考虑到相机本身的处理,恢复得到一个不带相机处理的三维场景。进一步,我们还可以像相机处理二维图片一样,我也可以提出了三维空间中的图像处理(3DISP)提升三维场景的质量。这套算法的核心在于我们提出用一个双边神经网络(bilateral grid),来模拟相机图像处理过程,以及如何将二维图像处理映射到三维。这一方法可以应用各种基于提渲染的三维重构算法,消除鬼影并提升三维场景颜色亮度,也获得SIGGRAPH24 honorable mention。
|
|
报告人简介:薛天帆教授是中文大学讯息工程系校长助理教授。在此之前,他在谷歌研究院担任主任工程师超过五年。他获得了麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士学位,师从William T. Freeman。2011年,他获得了中文大学的哲学硕士学位;2009年,他从清华大学获得了学士学位。他的研究重点是计算摄影、计算机视觉与图形学,以及机器学习。他的研究在学术界和工业界都引起了显著关注。他研究的反射光技术被谷歌Photoscan应用,该应用拥有超过1000万用户。他研究的快速双边学习技术已被集成到谷歌Tensor芯片中。他开发的夜景算法赢得了DPReview的最佳创新奖。他还担任多个顶级会议和期刊的审稿人,并担任CVPR 2020的网络主席,以及WACV 2023,ACM MM 2024,CVPR 2023和2024的领域主席(Area Chair)。
|
技术论坛11:图形学与具身运动智能 |
---|
论坛召集人:刘利斌,马月昕 |
---|
论坛讲者:刘利斌,顾家远,王泰,李镇,崔运国,马月昕 |
召集人简介:刘利斌,北京大学智能学院助理教授。博士毕业于清华大学,后曾于加拿大不列颠哥伦比亚大学(The University of British Columbia)及美国迪士尼研究院(Disney Research)进行博士后研究,以及美国硅谷创业公司DeepMotion Inc.担任首席科学家。入选国家级青年人才项目。研究领域为计算机图形学与具身智能,特别是面向数字人和人形机器人等具身智能体的动作仿真与控制,以及相关的物理仿真、机器学习、强化学习等领域。在相关领域发表论文20余篇,曾获得 SIGGRAPH Asia 2022 最佳论文奖、SIGGRAPH 2023 最佳论文荣誉提名等奖项。他曾多次担任图形学领域重要国际会议如SIGGRAPH (North America/Asia)、EG、PG、SCA等的论文程序委员,并担任IEEE TVCG 编委。 | |
召集人简介:马月昕,上海科技大学研究员、助理教授、博导。博士毕业于香港大学,曾到法国国家信息与自动化研究所、美国北卡罗莱纳大学教堂山分校、百度研究院进行访问学习。主要研究方向为三维视觉、机器人,尤其是三维场景理解、多模态感知、具身智能、自动驾驶等。共发表相关领域顶会或顶刊论文60余篇,包括Science Robotics、TPAMI、CVPR、ICCV、ECCV、SIGGRAPH、AAAI等,其中一作和通讯论文30余篇。获得上海市海外高层次人才、上海市优秀教学成果(高等教育类)一等奖、国家自然科学基金青年基金项目等。曾获SemanticKITTI、NuScenes、Argoverse等多个自动驾驶挑战赛冠军和亚军。 |
报告题目:物理3D动画技术与具身运动控制
|
|
报告摘要:灵活多样的动作是数字人技术的重要组成部分,也是3D动画研究的主要目标。其中,物理3D动画强调从物理规律出发,在仿真环境中构建动作的动力学过程,进而实现灵活的运动控制策略。相对于机器人领域的运动仿真,物理3D动画省略了部分硬件约束,从而更加关注于动作的真实感和多样性。近年来,人形机器人等机器人软硬件系统的快速进步,以及对动作灵活度的要求,让物理3D动画技术与机器人技术的融合展现出巨大的潜力。本报告将简要介绍物理3D动画与机器人领域的关系,并介绍我们在基于大规模动作数据的运动控制策略生成式建模,以及将物理3D动画与机器人运动控制结合的一些尝试。 | |
报告人简介:刘利斌,北京大学智能学院助理教授。博士毕业于清华大学,后曾于加拿大不列颠哥伦比亚大学(The University of British Columbia)及美国迪士尼研究院(Disney Research)进行博士后研究,以及美国硅谷创业公司DeepMotion Inc.担任首席科学家。入选国家级青年人才项目。研究领域为计算机图形学与具身智能,特别是面向数字人和人形机器人等具身智能体的动作仿真与控制,以及相关的物理仿真、机器学习、强化学习等领域。在相关领域发表论文20余篇,曾获得 SIGGRAPH Asia 2022 最佳论文奖、SIGGRAPH 2023 最佳论文荣誉提名等奖项。他曾多次担任图形学领域重要国际会议如SIGGRAPH (North America/Asia)、EG、PG、SCA等的论文程序委员,并担任IEEE TVCG 编委。
|
报告题目:服务于具身智能的数字资产 |
|
报告摘要:在具身智能领域,通用机器人决策模型的开发取得了显著进展。然而,收集真实世界的训练数据和对这些模型进行真实环境下的评估仍然成本高昂。仿真技术提供了一种可行的替代方案,但其有效性高度依赖于多样且逼真的数字资产。传统上,这些资产主要由游戏产业创建,但随着具身智能的发展,对高质量数字资产的需求激增,以提高仿真环境的多样性和逼真度。这引发了一系列关键问题:这些资产的真实程度应达到何种水平?我们如何有效地创建这些仿真环境?在此过程中,哪些工具是必不可少的?在这个过程中,哪些工具是必不可少的?在本次报告中,我将介绍我们最近的工作—— SimplerEnv,一个专为评估基于真实世界数据训练的决策模型而开发的仿真环境平台。该平台支持对多种通用机器人操作模型的评估,如RT-1和Octo。此外,我还将讨论我们的另一个研究成果——Point-SAM,一个3D原生工具,能够对三维部件和物体进行交互式分割。理解物体的功能性部件对具身智能的研究至关重要,这一工具为此提供了重要支持。
|
|
报告人简介:顾家远,上海科技大学信息科学与技术学院助理教授,博士生导师。博士毕业于加州大学圣地亚哥分校,师从苏昊教授。2018年本科毕业于北京大学信息科学技学院智能科学系。研究方向为具身智能,聚焦于服务于具身智能的三维视觉和可泛化的机器人决策模型,在计算机视觉、机器学习、机器人等国际顶级学会会议(CVPR,NeurIPS,ICLR,ICRA等)上均有发表。参与的项目Open X-Embodiment获得了ICRA 2024的Best Paper Award。同时,他也担任相关领域会议的审稿人,并在RSS,ECCV,CVPR等学术会议上组织过相关的研讨会和教程。
|
报告题目:大规模具身多模态三维感知与交互
|
|
报告摘要:近年来,大语言模型和多模态大模型在扩展定律方面的探索取得重要进展。更进一步,在实现大模型赋能真实世界并从交互中持续学习的过程中,数据的匮乏阻碍了大规模具身智能研究的发展。本报告将聚焦这一问题,介绍近期在该领域scale up的初步尝试和进展。具体包括构建具身多模态三维感知与交互的大规模数据集和基准,覆盖真实场景和仿真可交互场景,以扩展当前具身智能研究的数据和模型规模,旨在构建面向具身智能的基础模型;同时提供下游交互学习的基础设施,推动大规模具身智能研究的标准化、高效训练和客观评测。
|
|
报告人简介:王泰,上海人工智能实验室青年研究员,博士毕业于香港中文大学MMLab,研究方向为具身智能和三维视觉。过往工作有二十余篇论文在顶级会议和期刊上发表,谷歌学术引用2600余次,多篇被选中做口头报告或获得满分评审,并在国际顶级竞赛中获奖。早期FCOS3D系列工作、近期 EmbodiedScan, GRUtopia(浦源·桃源)和PointLLM等及相关开源工作如MMDetection3D在通用三维感知和具身多模态感知交互等领域的学界和业界有广泛影响。曾获ICCV研讨会最佳论文、港府奖学金等荣誉。
|
报告题目:Multimodal Enhanced 3D Perception and its Applications
|
|
报告摘要:As a basic 3D representation form, point cloud is active in various tasks such as autonomous driving, embodied AI, biomolecular structure prediction and design. Although the 3D perception has achieved good development, multimodal enhanced 3D perception is in urgent need, especially with LLM and VLM. Starting from the collection of point clouds, this talk first proposes a point cloud down-sampling and recovery algorithm based on reversible networks, which greatly improves the storage and communication efficiency. After we can effectively obtain point cloud data, we have studied classic tasks such as point cloud shape classification, point cloud 3D detection and tracking, and large scene 3D semantic segmentation, occupancy prediction and reconstruction from single modality to multimodal. Our algorithm has achieved excellent results in many public international competitions, e.g., the novel prize for the occupancy prediction in CVPR24 Autonomous Grand Challenge, the first place in SemanticKitti semantic segmentation, the first place in CVPR2023 HOI4D segmentation, etc. In the end, we extended the 3D perception technologies to downstream applications, such as taking face generation, protein and small molecule/RNA binding prediction, etc.
|
|
报告人简介:Zhen Li is currently an assistant professor at the School of Science and Engineering (SSE) of The Chinese University of Hong Kong (Shenzhen)/Future Intelligent Network Research Institute (FNii)-Shenzhen. Dr. Zhen Li was selected for the Wu Wenjun Outstanding Youth of 2023, 2021-2023 Seventh China Association for Science and Technology Young Talent Support Project. His research interests include interdisciplinary research in artificial intelligence, 3D vision, computer vision, and deep learning-assisted medical big data analysis. He has published over 60 papers in top conferences and journals, such as top journals Cell Systems, Nature Communications, IEEE TPAMI, IEEE TNNLS, IEEE TMI, PLOS CB, Bioinformatics, JCIM etc., and top conferences CVPR, ICCV, ECCV, NeurIPS, ICLR, MM, AAAI, IJCAI, ACL, ECAI, MICCAI, RECOMB, etc.
|
报告题目:人形机器人技术和产品迭代
|
|
报告摘要:随着科技的不断进步,人形机器人的技术和产品正经历着快速的迭代。人形机器人作为人工智能和机械工程的高度融合产物,在多个领域展现出巨大的潜力。运动控制技术的不断提升,使得人形机器人的动作更加流畅自然,接近人类的运动模式。人工智能算法的发展,赋予了人形机器人更强的学习能力和决策能力,能够自主完成复杂的任务。报告将首先介绍相关人形机器人硬件技术的现状和迭代,然后,介绍通用人工智能在人形机器人中的应用,最后,介绍人形机器人的应用前景及产业链情况。
|
|
报告人简介:崔运国,杭州宇树科技有限公司技术支持总监。2014年毕业于兰州理工大学自动化专业,多年机器人、自动化行业经验。现任宇树科技技术支持总监,工作期间参与宇树科技人形机器人H1、G1 的设计、研发、测试等工作,主导宇树科技科研、教育方向的应用支持等工作,参与撰写“十四五”高等教育教材体系《人形机器人技术基础与应用》教材。目前工作方向为人形机器人教育行业解决方案及行业落地解决方案。
|
报告题目:具身智能年度进展报告
|
|
报告摘要:具身智能依赖于物理实体与环境的动态交互来感知信息、分析问题并执行任务,是智能科学最前沿的研究方向之一,也是通用人工智能的关键应用之一。感知、认知与行为是具身智能中的主要模块,三者相互依存、相互制约,共同构成闭环的动态智能系统。本报告将概述具身智能中感知、认知与行为的通用模型研究的最新进展,并对目前存在的挑战与未来的研究方向进行探讨。
|
|
报告人简介:马月昕,上海科技大学研究员、助理教授、博导。博士毕业于香港大学,曾到法国国家信息与自动化研究所、美国北卡罗莱纳大学教堂山分校、百度研究院进行访问学习。主要研究方向为三维视觉、机器人,尤其是三维场景理解、多模态感知、具身智能、自动驾驶等。共发表相关领域顶会或顶刊论文60余篇,包括Science Robotics、TPAMI、CVPR、ICCV、ECCV、SIGGRAPH、AAAI等,其中一作和通讯论文30余篇。获得上海市海外高层次人才、上海市优秀教学成果(高等教育类)一等奖、国家自然科学基金青年基金项目等。曾获SemanticKITTI、NuScenes、Argoverse等多个自动驾驶挑战赛冠军和亚军。
|
技术论坛12:智能交互与设计 |
---|
论坛召集人:王冠云 |
---|
论坛讲者:吕菲、王巍、米海鹏、袁晓芳、韩腾、郭子淳 |
召集人简介:王冠云,浙江大学计算机学院、国际设计研究院特聘研究员,博士生导师,工业设计系副主任,国家优秀青年科学基金获得者,浙江省杰出青年科学基金获得者,小米青年学者。主要研究领域为实体交互界面、仿生变形设计、变形材料与设计、4D打印等;研究成果在Nature、Science Advances、CHI、UIST、UbiComp等顶尖期刊及会议上发表;设计作品荣获红点、iF、Ars Electronica等国际设计大奖;设计作品受邀参加中国设计大展、迪拜国际设计周、伦敦设计双年展等国内外设计展览。 |
报告题目:智能时代的交互设计人才培养与创新研究
|
|
报告摘要:目前全球进入了万物互联、虚实融合的智能时代,在这一背景下,交互设计的内涵和外延不断扩展,对设计人才的培养也提出了更高要求。北京邮电大学智能交互设计专业是教育部批准的国内首个智能交互设计专业,专业依托北邮信息技术优势,将设计创意与智能技术有机融合,打造以“智能计算+交互设计创新”为育人特色的新工科专业。报告将介绍北京邮电大学智能交互设计专业在培养方案设置、教学体系设计及产教融合创新等方面的探索与取得的成果。 | |
报告人简介:吕菲,北京邮电大学教授、博士生导师,数字媒体与设计艺术学院副院长,智能交互设计专业负责人,国家高层次青年人才。研究领域为交互设计,主持国家自然科学基金项目、北京市社会科学基金项目(优秀)、百度项目等课题,获iF设计奖,指导学生获全国/省部级奖项100余项。担任ACM SIGCHI中国执行委员会委员、中国计算机学会人机交互专委会执委、中国工业设计协会信息与交互设计专委会委员。担任国际顶级会议ACM CHI 2019设计分会副主席、国际重要会议HWID 2021大会程序主席、国际重要会议ACM SUI 2023工作坊与专题会议主席。
|
报告题目:智能人因设计与多模态交互 |
|
报告摘要:人因研究是一个人机交互与工业设计交叉领域。本报告通过介绍智能人因设计发展、相关方法范式与案例,探讨多感官人因与多模态交互领域研究思考。
|
|
报告人简介:王巍,湖南大学教授,博士生导师,湖南大学岳麓学者。现任湖南大学设计艺术学院副院长,艺术与设计国家级实验教学示范中心主任,湖南大学学术委员会委员,麓山实验室副主任,智能人因设计湖南省重点实验室副主任,兼任中国工业设计协会信息交互专委会副主任委员、中国计算机学会人机交互专委会执行委员、全国工业设计基础标准化工作组委员等。
|
报告题目:人工智能助力传统艺术数字化创新—以皮影为例
|
|
报告摘要:传统艺术数字化是一个有趣且具有挑战的问题。如何在保留传统艺术的核心特征基础上,提供具有良好交互特性的数字化工具,对于文化创意与设计相关行业有重要的应用价值。本报告将介绍一种面向中国皮影戏的创作工具,它可提供轮廓模板、动画、场景编辑工具和机器生成的传统木偶图案。这些功能将创作者从繁琐的任务中解放出来,让创作者专注于创作过程。这项工具支持了各种创作者进行生产使用,覆盖动画、游戏等各个领域。
|
|
报告人简介:米海鹏,博士,副教授,2017年入选国家青年人才计划,同年荣获清华大学“学术新人奖”。现任教于清华大学美术学院信息艺术设计系,清华大学未来实验室客座研究员。他的主要研究兴趣包括智能交互、机器人交互,以及交互艺术等。他具有科学技术与艺术的双重教育背景,致力于探索科学与艺术的碰撞与交叉。他已发表超过50篇学术论文,并多次担任ACM CHI,UIST,HRI等会议审稿人。还曾担任Chinese CHI 2023会议程序委员会主席。
|
报告题目:自动驾驶汽车智能交互设计探索
|
|
报告摘要:在自动驾驶场景下,汽车与驾驶员、乘客以及外部环境之间的智能交互成为了一个关键课题。本报告旨在探索自动驾驶汽车的智能交互,重点介绍以下几个方面:分析驾驶员在使用自动驾驶功能时的行为特点,设计合理的人机交互界面和控制权转移机制,确保驾驶安全和驾驶体验;针对不同乘客群体(如老人、儿童等)的需求,设计个性化、舒适、便捷的乘车服务,提供娱乐、办公等多功能交互。本报告将重点阐述自动驾驶汽车智能交互的关键技术、应用场景和发展趋势,为推动自动驾驶技术的发展和应用提供参考和指导。
|
|
报告人简介:袁晓芳,国家级人才(青年),同济大学设计创意学院-长聘教授、博士生导师、麻省理工学院访问学者。主要研究方向为人工智能语境下的人机交互,尤其是智能汽车(HMI)、人-智能机器人(HRI)交互设计方法和技术。以第一作者/通讯作者发表了20余篇高水平学术论文。主持和承担了国家重点研发计划智能机器人项目子课题、国家重点研发计划工业软件专项、国家自然科学基金、湖北省重点研发计划、湖北省自然科学基金项目等10余项科研项目。曾任数字舞台设计与服务文化与旅游部重点实验室副主任,武汉理工大学人机交互与智能设计研究中心主任。
|
报告题目:通过刺绣构建纺织品界面原型
|
|
报告摘要:随着电子纺织品在传感、驱动和制造方面的不断进步,将智能融入织物已成为普适计算和交互领域的研究热点。然而,开发多模式输入和输出的智能纺织品接口通常需要专业的材料、制造和协议知识。基于纺织品刺绣,可通过专用的传感、驱动和连接组件进行美观、精确的图案化设计,兼容多种线材和底布,支持智能纺织品界面的设计和原型制作,可用于多种生活场景下的纺织品界面原型制作,展现其触摸输入以及视觉和触觉输出的特性。
|
|
报告人简介:韩腾,中国科学院软件研究所研究员,博导,国家级青年人才获得者,获中科院人才项目支持。本科毕业于西安交通大学工业设计系,博士毕业于加拿大曼尼托巴大学人机交互实验室。其主要研究方向为自然人机交互、触觉感知和柔性触觉界面。发表ACM CHI、UIST、IMWUT/Ubicomp等人机交互国际顶级会议/期刊论文三十余篇,两次获最佳论文提名奖,并发表国际高水平SCI期刊npj Flex. Elect.、Nature Comm.、Adv. Intel. Sys.等。目前主持、参与国家自然科学基金重点项目、面上项目等国家课题,并主导了多项企业合作项目。
|
报告题目:面向未来的智能叙事设计研究:具身交互叙事
|
|
报告摘要:当今,人工智能与具身交互技术的融合正处于设计学范式的零界点。研究认为,具身智能技术正在改变未来的叙事形态,以具身交互技术为核心的具身叙事设计开始浮现,围绕“身体观”的交互感知已经成为未来智能叙事设计的重要表征,传统的叙事设计研究开始从传统的“离身叙事”转向“具身设计”,这为未来智能设计的研究路径和学科交叉提供了全新的思路——具身交互叙事设计。
|
|
报告人简介:郭子淳,北京化工大学教授,百人青年英才。主要研究方向为未来影像与智能媒体设计、具身交互叙事设计等。清华大学未来实验室客座研究员,北京交叉科学学会设计创新专业委员专委,北京市智慧广电重点实验室副主任,CCF人机交互,虚拟现实执行委员。主持国家社会科学面上、教育部青年等基金。多篇论文入选教育部高等学校文科学术文摘、人大复印资料,相关成果并被中宣部及广电总局采纳。第13届澳门国际电影节最佳导演、第11届“学院奖”二等奖、伦敦猎鹰国际电影节最佳惊悚片等。
|
技术论坛13:大模型时代的虚拟现实技术:前沿与挑战 |
---|
论坛召集人:汪淼 |
---|
论坛讲者:章国锋、张磊、姚遥、石伟男、黄浩智 |
召集人简介:汪淼,北航虚拟现实技术与系统全国重点实验室副教授,博士生导师。研究方向为可视媒体智能生成、混合现实沉浸交互。发表学术论文40余篇,曾获国家科技进步二等奖1项(排名9),入选中国科协青托工程。担任CAVW期刊编委、图学学报编委、Fundamental Research期刊青年编委、ChinaVR 2024程序主席,多次担任IEEE VR、ISMAR等国际会议程序委员。现任CCF虚拟现实与可视化技术专委秘书长。 |
报告题目:基于三维高斯表达的场景重建、渲染与定位
|
|
报告摘要:近年来,三维高斯泼溅技术作为新的三维表征取得了很大的成功,引起了业界的广泛关注。一系列基于三维高斯表达的三维重建、渲染和定位方法不断涌现出来,并开始在实际场景中落地应用。本报告将重点汇报我们团队在这方面的研究进展,并对未来发展方向进行探讨和展望。
|
|
报告人简介:章国锋,浙江大学教授,博导。主要从事三维视觉与增强现实方面的研究,尤其在SLAM和三维重建方面取得了一系列重要成果,开源了一系列相关系统和算法的源代码,是OpenXRLab扩展现实开源平台的主要发起人。曾获2010年CCF优秀博士学位论文奖、2011年全国优秀博士学位论文奖、2021年浙江省自然科学奖一等奖(排名第2)以及国际顶级会议ISMAR 2020唯一最佳论文奖。担任国际顶级期刊IJCV编委,以及《Virtual Reality & Intelligent Hardware》和《计算机辅助设计与图形学学报》等期刊编委。
|
报告题目:结合全景特性的室内场景光照分解及应用 |
|
报告摘要:光照分解是从输入的图像分析并提取场景中包含的环境光信息以及物体表面的反射属性,在虚拟现实、增强现实等领域有着重要应用。全景图像提供了360°视场角的场景呈现,包含更全面、丰富的场景光照、几何等信息。结合这些全景特性,能够对求解光照分解问题提供更有效的引导和约束。本报告介绍结合全景特性的光照分解方法,并展示相关应用效果。
|
|
报告人简介:张磊,北京理工大学计算机学院长聘教授,博士生导师,国家优秀青年基金获得者。担任可视媒体计算研究所所长,智能信息技术北京市重点实验室副主任。2004年和2009年分别在浙江大学获得学士和博士学位。研究方向为计算机图形学、图像与视频处理。承担国家重点研发课题、国家优青、面上等项目,在TOG、TVCG、TIP等发表论文六十余篇。出版教材1部,承担北京理工大学研究生精品课程1门。
|
报告题目:可拓展原生三维生成大模型
|
|
报告摘要:近年来,三维内容生成研究得到了快速发展。然而,现有方法大多采用多视图生成结合多视图三维重建的方式进行三维生成,在多视角一致性、重建几何质量以及生成速度上都还存在较大提升空间。本次报告将介绍我们最新关于可扩展原生三维生成模型的工作Direct3D。Direct3D通过精心设计的3D VAE将三维模型编码到紧凑连续的三维隐空间,并通过输入图像控制的3D Diffusion Transformer(DiT)实现高质量的单视图三维生成。所提方法不依赖于多视图扩散模型(MVD)、图像扩散模型分数蒸馏采样(SDS)以及大重建模型(LRM),可以直接在三维数据上训练得到高质量的3D DiT。大量实验表明Direct3D相比于先前方法可以得到更好的image-to-3D生成质量,并可以通过加大训练数据与参数大小的方式持续提升模型的生成质量及泛化性。
|
|
报告人简介:姚遥,南京大学智能科学与技术学院副教授、博士生导师,国家级人才计划青年项目入选者。香港科技大学博士(导师:权龙教授),曾任Altizure创始团队核心成员,后随公司收购加入苹果,任苹果公司高级研究员。主要研究方向为三维重建与生成,代表性工作包括MVSNet系列工作、NeILF系列工作以及Direct3D系列工作,谷歌学术引用超3900次,曾获2020年国际模式识别大会最佳学生论文奖。现作为负责人承担国自然海外优青项目、国自然元宇宙专项项目及科技部重点研发计划课题。
|
报告题目:情境感知的智能人机交互
|
|
报告摘要:随着信息技术的飞速发展,我们正进入一个人机物三元融合的计算时代。传感器和信息服务在环境中无处不在,海量的信息服务、多样化的用户群体和复杂的使用场景对人机交互领域提出了新的挑战,亟需摆脱传统的“人适应机器”的范式,转向更为先进的“机器适应人”的策略。本报告探讨了以情境感知为基础的智能人机交互框架,探索了多模态用户输入行为特征、用户意图理解策略以及信息服务的构建与执行方法,以使得不同的用户群体都能够方便高效地访问信息服务。
|
|
报告人简介:石伟男,清华大学计算机系助理研究员,2016年、2021年于清华大学获得学士、博士学位。主要研究方向是智能人机交互,包括文本输入、情境感知、可穿戴设备和无障碍等方面工作。研发的基于手指运动控制能力⻉叶斯模型的智能文本输入方法,在搜狗输入法中作为关键特性得以应用,服务用户规模超6亿,日均输入900亿字,显著提升纠错字符串的召回率和线上纠错的点选率;提出世界上首款盲人键盘,根据盲人用户输入进行字符级纠错,显著降低输入错误率。曾获得ACM CHI Honorable Mention Award、中国人因工程设计大赛一等奖等。
|
报告题目:大空间VR内容创作中AI应用的机遇与挑战
|
|
报告摘要:大空间VR,或称Location-Based VR,是一种时兴的数字沉浸式虚拟现实体验。元象目前已在全国各地开出多家大空间VR体验店,并持续高频输出主题各异的大空间VR内容。本报告将介绍元象在大空间VR内容创作过程中重点关注的问题,从场景和人物两个方面阐述当前应用AI来加速内容创作面临的机遇和挑战。
|
|
报告人简介:黄浩智博士,元象XVERSE 技术合伙人,图形学与计算机视觉领域算法与工程专家,目前领导元象开发端云协同的下一代图形引擎与AI驱动的3D内容生产工具集。此前曾任腾讯 AI Lab 图形学组长,参与艺术滤镜、人体姿态估计、虚拟人、神经网络渲染、真实感渲染等技术研发。同时,担任CVPR、ICCV、ECCV、TIP等顶级国际会议和期刊的审稿人。拥有清华大学计算机博士学位。
|
技术论坛14:图形学与具身感知智能 |
---|
论坛召集人:胡瑞珍 |
---|
论坛讲者:弋力,贾宝雄,方斌,王越,李永露 |
召集人简介:胡瑞珍,深圳大学特聘教授,博士生导师,国家优秀青年科学基金、广东省杰出青年项目获得者。研究方向为计算机图形学,长期从事智能几何建模与处理方面的研究,发表 ACM SIGGRAPH/TOG 论文三十余篇;入选中科协青年人才托举工程;荣获亚洲图形学协会青年学者奖、全国几何设计与计算青年学者奖;担任期刊IEEE TVCG、IEEE CG&A和Computers & Graphics等国际期刊编委;担任国际会议SGP 2024、CVM 2023和SMI 2020程序委员会主席,连续多年担任SIGGRAPH等大会程序委员会委员;担任中国计算机学会计算机辅助设计与图形学专委会常委、计算机图形学与混合现实在线平台(GAMES)线上活动运营负责人。 |
报告题目:多模态大模型驱动的开放世界具身感知与交互
|
|
报告摘要:当前的具身智能研究大多聚焦于在特定环境下针对特定技能的学习,距离实现在开放环境中解决各种任务的通用智能目标还有较大差距。近年来,多模态大模型的快速发展使得在开放环境中的感知理解任务表现出色。因此,如何利用和发展多模态大模型以驱动具身通用智能的发展,成为了一个值得探索的自然想法。本次报告将从两个角度展开讨论:一是如何从现有的多模态大模型中继承知识,以驱动通用泛化的感知与交互;二是如何发展更加适配于具身智能体的多模态大模型。一方面,我们可以利用现有多模态大模型关于海量知识的表征,以规划智能体更加多样化的交互行为,大幅拓展其交互技能。另一方面,我们从想象力和交互力的角度出发,打造面向具身规划的多模态大模型。我们相信具身大模型会为通用具身智能的发展提供强有力的范式。 | |
报告人简介:弋力博士现任清华大学交叉信息研究院助理教授,国家优青(海外)。他在斯坦福大学取得博士学位,导师为美国三院院士Leonidas J. Guibas教授,毕业后在谷歌研究院任研究科学家。他近期的研究聚焦于三维视觉与具身智能,他的研究目标是赋予机器人理解并与三维世界交互的能力。他在计算机顶级会议期刊上已发表论文六十余篇,引用数两万余次,代表作品包括ShapeNet Part,SyncSpecCNN,PointNet++等,大大影响了三维深度学习这一领域的出现与发展。此外他还曾担任CVPR、IJCAI、NeurIPS等顶会的领域主席与SIGGRAPH TPC等。
|
报告题目:具身智能视角下的三维场景理解、生成与交互 |
|
报告摘要:近年来,3D场景理解、生成与交互的融合极大地推动了具身人工智能(Embodied AI)的发展,使智能体能够以更接近人类的方式感知、理解并操控其环境。本次报告将从具身人工智能的视角回溯我们在三维场景理解、交互等方向的研究工作,讨论其中的关键发现及未来可能的研究方向。
|
|
报告人简介:贾宝雄,北京通用人工智能研究院通用视觉实验室研究员,博士毕业于美国加州大学洛杉矶分校,期间师从朱松纯教授并曾于AmazonAlexaAI实习,研究方向包括场景理解、行为理解、具身智能等。代表工作为LEMMA,ARNOLD,LEO,Sceneverse,发表顶会论文二十余篇(CVPR,ECCV,ICV,NeurPS,ICLR,ICML,IROS)。曾组织多届会议研讨会、长期担任国际顶级期刊及会议审稿人,并曾获得CVPR及ICLR优秀审稿人奖。
|
报告题目:Tacchi视触觉仿真的具身感知操作
|
|
报告摘要:随着大语言模型ChatGPT的出现,具身智能成为了OpenAI, Google,英伟达等世界前沿科技公司的重点发展方向。如何提升具身触觉感知能力也成为了其中是亟待研究的热点问题。报告介绍了视触觉传感的发展历程,进一步介绍了基于图形学开源软件太极开发的视触觉仿真器Tacchi ,重点阐述了基于视触觉感知及操作研究工作,最后探讨了具身智能的未来发展趋势和思考。
|
|
报告人简介:方斌,北京邮电大学“拔尖人才”教授,主要研究方向具身智能、机器人大模型。兼任中国人工智能学会认知系统与信息处理专委会秘书长,中国人工智能学会杰出会员, 中国计算机学会智能机器人专委会常务委员,IEEE 高级会员。发表Nature Communications、IEEE TRO、Soft Robotics等高水平期刊及ICRA等会议论文上百篇,出版中英文专著各1部,获得国际会议/国际期刊最佳论文奖8项。作为首席客座主编在多个SCI国际期刊组织了机器人灵巧操作的专刊。多次指导学生在国际比赛中获得冠军,曾被清华大学评为“优秀指导教师”。研制的触感灵巧手入选了国家“十三五”科技创新成就展。同时获得了IEEE仿生机电及机器人技术委员会“早期职业生涯奖”、中国指挥控制学会“青年科学家奖”、北京市“创新大工匠”,ICRA 2024 “新一代学术之星”等。
|
报告题目:图像目标引导的操作与导航
|
|
报告摘要:给定任务目标是机器人自主完成任务的前提。与精确坐标和粗粒度语言相比,把图像作为任务目标的表征形式有时更高效简单。本报告从图像目标任务视角下的物体位姿估计入手,介绍课题组近年来在机器人视觉伺服、物体抓取和放置以及语义导航等任务所做的探索。
|
|
报告人简介:王越,教授,浙江大学控制科学与工程学院。近五年来以通讯作者发表Nature Communication、IJRR、TPAMI、TRO、IJCV等期刊论文30多篇,发表RSS、ICRA、IROS等领域顶会30多篇,获ICRA最佳视觉论文,IROS最佳设计论文提名等论文奖6次,年度全球前2%顶尖科学家。担任期刊IEEE Robotics and Automation Letters编委、期刊Frontiers in Robotics and AI、Electronics邀请编委、ICRA/IROS编委等。获中国发明协会创业创新奖二等奖(排名1)等。主持科技部重点研发计划课题、国家自然科学基金项目等项目,与华为、阿里、中核、航天等企业和研究机构长期合作。
|
报告题目:具身智能与视觉推理
|
|
报告摘要:具身智能的目标是实现可与物理世界交互的智能体,其必要条件之一是智能体必须具备可泛化、高效、可解释的推理能力。本报告以具身智能视角下的视觉推理为出发点,以机器人、人、物体和环境等要素为抓手,介绍上交RHOS团队在环境感知、视觉推理和具身智能相关领域的研究,展示我们近期在人机协同遥操作、操作策略学习、物体理解相关的新工作。
|
|
报告人简介:李永露博士,上海交大助理教授,博导,主要研究具身智能、视觉推理、行为理解,代表工作HAKE(官网全球访问14万+)、AlphaPose(Github Star 7K)。发表研究成果30余篇(TPAMI、NeurIPS、ICML、CVPR、ICCV、ECCV、IJCV),谷歌引用2000次(7篇被引100+);开源项目20余项,获Github star 1.2万+。任上交ACM班《计算机视觉》课程教师、NeurIPS 2024 Area Chair,多种AI会议和期刊审稿人,VALSE EAC。主持、参与多项国家级项目,如青基、重点研发计划等,并得到CCF-腾讯犀牛鸟、四季青青年论坛的研究支持。获吴文俊奖-优博、上海市海外高层次人才、WAIC云帆奖-璀璨明星、明日之星、百度奖学金、NeurIPS’21/22杰出审稿人、2020华人学生AI百人、上海市优毕、上交-杨元庆教育基金优博。
|
技术论坛15:物理仿真 |
---|
论坛召集人:任博 |
---|
论坛讲者:王长波,何小伟,杨垠,高阳,王笑琨 |
召集人简介:任博,南开大学计算机学院副教授。主要研究方向包括计算机图形学基于物理/机器学习的仿真与控制,神经辐射场三维场景重建与渲染等。在国际顶级期刊会议(中科院一区,CCF A类)发表文章二十余篇。主持或参与多项国家自然科学基金青年/面上项目,国家重点研发计划课题与国家重点实验室开放课题。任中国图学学会理事会青年工作委员会委员与国际联络工作委员会委员,CCF CAD&CG专委会委员,CSIG智能图形专委会委员。在SIGGRAPH Asia,CVM,Pacific Graphics等图形学国际会议中出任分会场主席。 |
报告题目:数据与物理混合驱动的流体真实感仿真
|
|
报告摘要:流体真实感仿真是计算机图形学的经典和热点问题。基于物理的流体仿真方法计算量大难以稳定求解,数据驱动的方法可避免求解复杂物理方程,但动态性表现不够,因此统一的物理模型或者单一的数据无法表达流体的复杂运动与丰富细节。利用最新深度学习与可微计算方法,同时结合多源流体数据,提出多源数据与物理模型混合的流体真实感仿真思路,重点研究复杂流体的多元混合表达与建模、运动参数反求与迭代演化、物理规律耦合的细节增强等,从而实现典型复杂流体现象的高效真实感仿真。报告也将分享研究组在物理仿真方面的最新研究成果。
|
|
报告人简介:王长波,博士,华东师范大学教授、博士生导师,数据科学与工程学院党委书记。曾任华东师范大学软件学院副院长、计算机与软件工程学院常务副院长、计算机科学与技术学院党委书记。兼任中国计算机学会CAD&CG专委会常务委员、中国图象图形学学会可视化与可视分析专委会副秘书长、上海市计算机学会常务理事、上海市人工智能与社会发展研究会副会长、中国计算机学会上海分部副主席。已主持国家及省部级科研项目10多项,包括国家自然科学基金项目6项,在国内外知名学术会议和期刊上发表论文140余篇,出版专著和教材5部。担任国际会议VINCI2019、ChinaVis2018、CAD/CG2023会议主席、CVM2018组织委员会主席等。曾获上海市青年科技启明星、全国宝钢优秀教师奖、国家教学成果奖二等奖、上海市科技进步奖特等奖、上海申银万国奖教金、陆增镛CAD&CG高科技奖等。研究方向为计算机图形学、真实感仿真、数据可视化、虚拟现实等。
|
报告题目:开放场景实时物理仿真难点与挑战 |
|
报告摘要:传统工程仿真受限于数据结构、算力及软件架构,导致其计算域局限于特定区域,难以灵活适应开放场景中动态边界及复杂耦合环境的需求。本报告旨在深入剖析面向开放场景的实时物理仿真所面临的难点与挑战,从底层数据、核心算法以及引擎架构等多个层面进行详细阐述。此外,我们将结合课题组在刚体/多体动力学、流体动力学等领域的最新研究成果,展示相关领域的最新进展。
|
|
报告人简介:何小伟,中国科学院软件研究所研究员,研究方向包括计算机图形学、物理仿真和基于GPU的并行计算等。在包括ACM TOG、IEEE TVCG、MICCAI等相关领域重要期刊/会议发表论文二十余篇,主持研制面向实时智能与交互的开源物理引擎——泛动引擎(PeriDyno),该引擎荣获计算机学会CAD&CG专委会2022年度“优秀图形开源软件”以及2023挑战者杯元宇宙开发者大赛全国总决赛二等奖。主持/参与包括国家自然科学基金、重点研发计划在内的多个国家纵向课题;相关成果应用于华为、中国船舶、迈曦软件等。2019年入选中国科学院青年创新促进会会员,2021年入选中科院软件所杰出青年专项支持,兼任CSIG智能图形专委会委员、第三/四届GAMES执行委员会委员等。
|
报告题目:Efficient GPU Cloth Simulation with Non-distance Barriers and Subspace Reuse
|
|
报告摘要:We show how to push the performance of high-resolution cloth simulation, making the simulation interactive (in milliseconds) for models with one million degrees of freedom (DOFs) while keeping every triangle untangled. The guarantee of being penetration-free is inspired by the interior-point method, which converts the inequality constraints to barrier potentials. Nevertheless, we propose a major overhaul of this modality by defining a novel and simple barrier formulation which does not depend on the distance between mesh primitives. Such a non-distance barrier model allows a new way to integrate collision detection into the simulation pipeline. Another contributor to the performance boost comes from the so-called subspace reuse strategy. This is based on the observation that low-frequency strain vibrations are near orthogonal to the deformation induced by collisions or self-collisions, often of high frequency. Subspace reuse then takes care of low-frequency residuals, while high-frequency residuals can also be effectively smoothed by GPU-based iterative solvers. We show that our method outperforms existing fast cloth simulators by nearly one order while keeping the entire simulation penetration-free and producing high-equality animations of high-resolution models.
|
|
报告人简介:Dr. Yin Yang is currently an Associate Professor with the Kahlert School of Computing at the University of Utah. Before joining the U, he was a faculty member at Clemson University and University of New Mexico. He received Ph.D. degree of Computer Science from The University of Texas, Dallas in 2013 (the awardee of David Daniel Fellowship Prize). He was a Research/Teaching Assistant at UT Dallas as well as UT Southwestern Medical Center. His research mainly focuses on real-time physics-based computer graphics, animation and simulation with a strong emphasis on interdisciplinarity. He was a Research Intern in Microsoft Research Asia in 2012. He received NSF CRII (2015) and CAREER (2019) awards.
|
报告题目:数据驱动的流体三维重建与动态演化
|
|
报告摘要:在图形学和VR领域,基于图像或视频的流体场景几何重建技术重要性日益显现,但这些方法往往基于迭代优化算法,对流体场景的光照环境、采集角度等要求较高,且多关注于几何形状重建,流场物理属性难以还原,难以支撑 VR/AR 应用中对流体场景的高沉浸、可交互、物理真实的需求。因此,本报告将重点从以下三个方面介绍团队在物理真实的流体重建方面的探索:基于可微渲染的流体几何重建方法;基于物理感知的流体逆向建模与动态演化方法;基于神经渲染的流体真实感动画生成。通过上述虚实融合的物理建模与演化技术分享,希望在流体表面几何重建、流体逆向建模与动态演化、实时真实感渲染等方面为研究者提供方法参考和思路借鉴。
|
|
报告人简介:高阳,博士,博士生导师,北京航空航天大学虚拟现实技术与系统全国重点实验室副教授,入选首届中国科协青年智库人才支持计划。主要研究方向为可视化物理仿真、真实感绘制、VR应用技术研究等。在图形学和VR/AR领域国内外知名期刊和会议TVCG、IEEE VR、AAAI、CVPR等发表文章40余篇。获2020年中国电子学会科技进步一等奖、2021年中国产学研合作创新成果一等奖等、2024年中国仿真学会科学技术一等奖。现任中国人工智能学会智能交互专委会委员、中国仿真学会医疗仿真专委会委员、中国图象图形学会虚拟现实专委会委员等,国际学术会议IEEE VR 2023/2024 程序委员会委员、CCF CAD-CG 2022-2024程序委员会委员,TVCG、CGF、AAAI等国际期刊和会议审稿人。
|
报告题目:粒子流体湍流增强与多相耦合研究及应用
|
|
报告摘要:基于粒子的流体仿真因其计算高效,应用灵活,表现力丰富的特点在工业与影视游戏应用中广受欢迎。本报告重点介绍研究组在该方向的研究探索:高效流体仿真中湍流细节恢复以及多组分流体耦合仿真问题。首先,针对流体仿真中数值耗散引起的高频细节丢失与表现力下降问题,采用涡度方程量化分析耗散,引入毕奥-萨法尔涡粒子积分机制,巧妙恢复被耗散的速度场信息,同时融合蒙特卡洛计算方法,优化计算效率,实现高质量湍流模拟。其次,针对多相流体场景下的互溶共存耦合仿真问题,基于体积分数机制,设计了隐式多相流动力学混合模型,解决了传统方法中计算耦合稳定性欠佳及动量守恒问题,扩展了应用范围。此外,本报告还将分享研究组将仿真技术应用于工业和医疗领域的相关成果。
|
|
报告人简介:王笑琨,北京科技大学智能科学与技术学院副教授,英国国家计算机动画中心Marie-Curie Fellow,荷兰格罗宁根大学伯努利研究所博后、访问学者,入选欧盟玛丽居里学者、北科青年学者、北京科协青年人才托举工程。在SIGGRAPH Asia,IEEE VR、EG、SCA、CGI、CGF等主流期刊会议上发表论文30余篇。曾获CGI2020最佳论文奖,CCF CAD & CG2022最佳论文,CASA 2022 AniNex最佳论文奖,中国黄金协会科技进步一等奖,中国电子学会科技进步二等奖等。主持承担了国家自然科学基金青年/面上项目、国家重点研发计划子课题、国家高端外国专家项目等10余项课题,参与科技创新2030-新一代人工智能重大项目、国家自然科学基金重点项目、三百万级以上企业重大课题等多项。担任国际会议CCCI 2021/2024、CASA AniNex workshop 2022/2023程序委员会主席,国际期刊Computer & Graphics、CAVW等Guest editor。
|
技术论坛16:图形学与三维视觉 |
---|
论坛召集人:崔兆鹏 |
---|
论坛讲者:施柏鑫、郭裕兰、施逸飞、许威威、韩晓光 |
召集人简介:崔兆鹏,浙江大学计算机科学与技术学院 “百人计划”研究员、博士生导师,国家级青年人才计划入选者。研究方向为三维计算机视觉,主要从事基于视觉信息的三维感知和理解,具体包括三维重建、多视角立体几何、三维场景理解、同步定位与地图构建、三维内容生成等。近年来在计算机视觉、机器人、计算机图形学、机器学习等领域的顶级期刊和会议上发表论文50余篇,曾获ICRA 2020机器视觉最佳论文提名、IROS 2021安全、安保和救援机器人最佳论文提名、3DV 2024最佳论文荣誉提名。 |
报告题目:基于光照分析的逆渲染
|
|
报告摘要:渲染在计算机图形学中是指由三维场景模型生成图像的过程,而逆渲染则是从图像反推三维场景的物理属性,包括几何形状、表面材质、光源分布等。通过逆渲染技术,可以重建真实世界的场景,并实现重光照、虚拟物体插入、材质编辑等面向三维视觉、增强现实或图像编辑的应用。本报告将分享在逆渲染任务中结合光照分析的三个方面:光照估计、光照建模与多光照采集,取得的一些研究进展。基于四种本征属性分解进行人脸图像光照估计的方法揭示了场景表观以何种方式密切依赖于场景光照,而对发光体进行光照建模的室内场景逆渲染方法以及在多种远距和近场光源下进行场景采集的物体逆渲染方法则展示了光照分析将如何提升逆渲染效果的例证。
|
|
报告人简介:施柏鑫,北京大学计算机学院视频与视觉技术研究所副所长,视频与视觉技术国家工程研究中心、多媒体信息处理全国重点实验室研究员、长聘副教授、博士生导师(“博雅青年学者”);北京智源学者。2013年博士毕业于日本东京大学,曾先后在麻省理工学院媒体实验室、新加坡科技设计大学、南洋理工大学、日本国立产业技术综合研究所从事研究工作。研究方向为计算摄像学与计算机视觉,发表论文200余篇(包括TPAMI论文26篇,计算机视觉三大顶级会议论文85篇)。论文获评IEEE/CVF计算机视觉与模式识别会议(CVPR)2024最佳论文提名(Best Paper, Runners-Up)、国际计算摄像会议(ICCP)2015最佳论文提名、入选国际计算机视觉会议(ICCV)2015最佳论文候选,2021年获得日本大川研究助成奖。科技创新2030—“新一代人工智能”重大项目首席科学家,国家自然科学基金重点项目负责人,国家级青年人才计划入选者。担任国际顶级期刊TPAMI、IJCV编委,顶级会议CVPR、ICCV、ECCV领域主席。IEEE、CCF、CSIG高级会员,APSIPA杰出讲者。更多信息请访问“相机智能”实验室主页:http://camera.pku.edu.cn
|
报告题目:Tangram-Splatting: 一种高效的高斯泼溅方法 |
|
报告摘要:三维高斯泼溅(3D Gaussian Splatting)在三维重建及新视角合成等领域得到了广泛的关注。尽管高斯泼溅技术在近期取得了快速进展,但较高的内存消耗和计算量依然是制约其大规模应用的主要瓶颈。在本报告中,将介绍一种受七巧板(Tangram)游戏启发的,利用形状先验来优化三维场景拟合的高效三维高斯泼溅方法。该工作在保持性能的同时,可减少60%的内存消耗,并显著降低训练成本。
|
|
报告人简介:郭裕兰,主要研究领域为三维视觉,包括三维重建与点云语义理解等。在IEEE TPAMI和CVPR等期刊和会议发表学术论文200余篇,谷歌学术总被引1.5万余次,连续四年入选Elsevier中国高被引学者,入选全球前2%顶尖科学家榜单、百度全球华人AI青年学者,获吴文俊人工智能优秀青年奖、ACM China SIGAI Rising Star。担任中国图象图形学学会三维视觉专委会秘书长,IEEE Transactions on Image Processing、Computers & Graphics、Visual Computer等国际学术期刊编委,CVPR 2023/2021、ICCV 2021、ECCV 2024、NeurIPS 2024、ACM Multimedia 2021等国际会议领域主席。
|
报告题目:神经隐式场中的正激励点云采样方法及应用
|
|
报告摘要:神经隐式场可以实现任意分辨率的三维形状表示,具有很强的灵活性。近些年来,神经隐式场在形状重建、新颖视点图像合成等领域取得了诸多重要的进展。然而,现有的神经隐式场大多采用密集采样的策略进行训练,这会带来网络训练效率低和部分预测可靠性差等问题。针对这些问题,我们提出了一种神经隐式场中的正激励点云采样方法,该方法通过分析网络的输入信息,动态地生成对训练具有正向激励作用的采样点。实验结果表明,该方法不仅能够有效提升神经隐式场的训练效率和可靠性,而且适用于形状重建、位姿估计等多个任务,具有较强的跨任务泛化能力。
|
|
报告人简介:施逸飞,国防科技大学副教授,国防科技大学-普林斯顿大学联合培养博士。研究方向为三维视觉、计算机图形学和智能机器人。入选中国科协青年人才托举工程、中国图学学会青年托举计划、湖湘青年英才、国防科技大学高层次创新人才。发表学术论文40余篇,包括IEEE T-PAMI、ACM TOG、SIGGRAPH、CVPR、ICCV、ECCV (Oral)等顶级期刊会议第一作者论文11篇,CCF A类13篇,1篇入选ESI热点论文(前0.1%)。主持湖南省优秀青年基金、国家自然科学基金青年项目、国防科技大学基石基金等项目8项,参与国家自然科学基金重点项目、国家重点研发计划等重要项目10余项,担任某重大科研任务主任设计师。获ACM Changsha Chapter新星奖、国防科技大学青年创新奖一等奖等。
|
报告题目:端到端的三维内容构建
|
|
报告摘要:三维场景的端到端重建近年来在基于图像的绘制、逆向重建等领域获得了快速的发展。该表达可通过可微绘制技术从传感器数据直接构建几何和材质的隐式表达,支持自由视点绘制、体积视频和全息会议等虚拟现实应用,简化了传统场景构建技术流程。本报告首先介绍基于NeRF与3DGS表达的的端到端三维重建技术,并对其在场景重建、材质计算、人体重建等三维内容构建上取得的进展进行介绍。
|
|
报告人简介:许威威,现任浙江大学计算机科学与技术学院CAD&CG国家重点实验室长聘教授,教育部长江学者。曾任日本立命馆大学博士后,微软亚洲研究院网络图形组研究员, 杭州师范大学浙江省钱江学者特聘教授。主要研究方向为计算机图形学,涵盖三维重建、深度学习、物理仿真。在国内外高水平学术会议和期刊发表论文100余篇,其中ACM Transactions on Graphics, IEEE TVCG、IEEE CVPR、AAAI等CCF-A类论文60余篇。获中国和美国授权专利15项。所开发的三维注册和重建技术在高精度扫描仪及人体三维重建系统中得到应用。2014年受国家自然科学基金优秀青年基金资助,主持国家自然科学基金重点项目一项,获浙江省自然科学二等奖一项。
|
报告题目:图形学方法论变迁:多阶段 vs 端到端
|
|
报告摘要:随着深度学习的发展以及大模型时代的到来,在图形学方向做研究的方法论也产生了一定的变化。在本报告中,我将首先为大家作简单的梳理和介绍,主要围绕以前的多阶段到目前的端到端,并介绍两种方法论的优缺点。最后,也将简单分享个人的一些思考,希望提供一点参考。
|
|
报告人简介:韩晓光博士,现任香港中文大学(深圳)理工学院助理教授,校长青年学者。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文近100篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。目前担任CVPR,NeurIPS、ECCV等国际会议领域主席,以及IEEE TVCG、Computer&Graphics 编委。 他的工作曾两次获得CCF图形开源数据集奖,曾两次入选CVPR最佳论文列表。
|
技术论坛17:几何建模与处理 |
---|
论坛召集人:辛士庆 |
---|
论坛讲者:张松海、方清、刘玉身、曹炎培、魏明强 |
召集人简介:辛士庆,山东大学计算机科学与技术学院教授、博士生导师。在几何计算和几何处理方面做了系统性的研究工作,发表论文100余篇,获得2017/2023年SPM大会最佳论文奖(第1名)、2021年吴文俊人工智能自然科学奖(2等)、2023年SIGGRAPH最佳论文奖(国内科研单位首次)、2024年CVM大会最佳论文奖、2024年GMP大会最佳论文奖。担任SIGGRAPH 2024程序委员会委员、国际学术期刊AI&Materials的编委。在教学方面,连续5年获得山东大学泰山学堂“毕业生最喜爱的老师”,并获得2022年山东大学泰山学堂“卓越教师”称号。 |
报告题目:三维场景高效合成
|
|
报告摘要:三维场景高效编辑合成是面向应用进行场景构建的关键环节。当下业界场景建模软件学习门槛高、交互复杂、手工交互量大,尚无法满足普通用户对复杂三维数字场景的生成需求。本报告主要围绕基于三维对象空间关联关系提取的三维场景合成问题进行探讨,包括三维场景空间关联关系的自动提取、满足用户偏好的三维场景交互合成、符合几何约束的VR场景构建、场景视点的自动推荐选取、形变场景的构建与组织等。
|
|
报告人简介:张松海,清华大学计算机系长聘副教授,教育部长江学者校企联聘教授,主要研究领域为计算机图形学与虚拟现实、图像/视频处理,具体方向包括三维内容生成、三维场景合成、VR交互等;近五年(2019年以来)在IEEE PAMI、IEEE TVCG、IEEE TIP、ACM SIGGRAPH、CVPR、ICCV、IEEE VR、ACM MM等CCF A类期刊和会议上发表论文40余篇;作为负责人承担科技部重点研发计划项目1项,国家自然科学基金委重点/国际项目2项;获国家科技进步二等奖1项(2018,排名第三)。
|
报告题目:统计点云重定向 |
|
报告摘要:从点云重建曲面是一项具有挑战的任务。因为点云本身并没有定义一个曲面,存在无数个曲面近似一个点云,因此这是一个不适定的问题。因此,添加额外的假设和约束是至关重要的。具有一致方向的定向法线提供了重建曲面的法向和在每个点的局部几何信息。本报告介绍一个简单而有效的方法来确定点云的法向。方法的核心是结合全局和局部信息来定义一个新的优化目标函数:在全局上,我们引入一个带符号的不确定性函数来区分曲面的内部和外部;受益于全局项的统计不确定性信息,定向估计可以用局部估计来替代。我们在各种复杂的点云上的实验验证了方法的能力和可行性。
|
|
报告人简介:方清, 现为中国科学技术大学计算数学方向博士后, 本科和博士毕业于中科大数学科学学院图形与几何计算实验室。主要研究方向为计算机图形学和数字几何处理,近年来在离散可展曲面、三角网格编辑与参数化等方向上发表多篇论文,包括ACM SIGGRAPH (Asia)、Computer-Aided Design等会议或者期刊。
|
报告题目:三维智能处理与重建
|
|
报告摘要:三维智能处理与重建是计算机图形学、三维计算机视觉、数字孪生领域中的研究热点,报告主要围绕激光扫描点云和多视图等获取的三维数据,介绍近年来三维智能识别、处理与重建的前沿技术,包括:三维智能识别技术,及其在对象识别、大规模模型检索中的应用;三维智能处理技术,及其在三维场景语义分割与补全中的应用,为后续场景重建与理解提供支撑;三维智能重建和生成技术,及其在数字孪生领域中的应用。
|
|
报告人简介:刘玉身,清华大学软件学院长聘副教授,博士生导师。2006年获得清华大学计算机科学与技术系的博士学位,导师孙家广院士;2006-2009年,美国普渡大学博士后;2009年至今,清华大学软件学院任教。主要研究方向是三维计算机视觉、几何智能处理与重建、建筑信息模型(BIM)。作为负责人主持国家自然科学基金项目5项,主持国家重点研发计划课题2项,参编国家标准3项(排名第3)。近五年以通讯作者,在TPAMI/TIP/CVPR/ICCV/NeurIPS/ICML等CCF A类期刊和会议发表论文50余篇,谷歌学术总引用4800多次。担任多个CCF A类国际会议的高级程序委员会委员和国际重要期刊编委、中国图学学会计算机图学专委会委员、中国铁道学会智能铁路委员会委员等。研究成果获得中国图学学会2022年度优秀博士学位论文、CCF CAD&CG专委员会2021年度“优秀图形开源数据集”奖、工程信息化领域旗舰期刊AEI高被引研究奖、土木与建筑工程计算领域旗舰会议(ICCCBE2016)最佳学生报告奖、计算机辅助设计与计算机图形学国际学术会议(CAD/Graphics 2005)最佳学生论文奖等,1篇TPAMI论文入选ESI高被引论文。教学成果获得清华大学精品课程、清华大学年度教学优秀奖、清华大学优秀班主任一等奖(2次)等,指导研究生多次荣获北京市优秀毕业生、清华大学优秀毕业生、校级优秀学位论文等。
|
报告题目:三维内容生成中的神经网络架构探索 |
|
报告摘要:随着三维生成式AI技术的迅速发展,高效、准确的三维数据表示和强大的神经网络架构成为推动三维内容生成进步的关键。本报告拟分享VAST团队在三维生成和三维神经网络架构方面的近期探索,以及对于该领域的一些思考。 |
|
报告人简介:曹炎培,2009-2013年,于清华大学计算机科学与技术系本科学习,获多次校级奖项。2013-2018年,继续攻读博士学位,师从胡事民院士,专注计算机图形学与三维视觉,期间赴德国RWTH Aachen University交流,获Pacific Graphics 2014最佳论文奖。在三维数字化、几何建模、生成式AI及真实感渲染等方面的研究成果,多次在SIGGRAPH、CVPR等顶级会议和期刊发表,累计引用超2000次。共同创立3D生成式AI开源项目threestudio,荣获2023年度CCF优秀图形开源项目奖。2017-2019年间作为创业公司Owlii的创始团队成员及CTO,开发高精度实时动态3D重建、压缩与传输系统,后于2019年被快手收购。2019-2021年,快手Y-tech高级研究员,开发低成本视觉动作捕捉系统、4D人脸几何和材质重建lightstage的软硬件系统,跨平台服务快手App等业务。2021-2023年,腾讯AI Lab和PCG ARC Lab专家研究员(T12)、三维方向负责人,负责三维数字化和三维生成方向的研究。2023年-今,VAST公司首席科学家。 |
报告题目:面向大型飞机的点云处理任务
|
|
报告摘要:点云处理已由传统的优化方法向智能化技术过渡,在三维建模、自动驾驶、视觉SLAM等领域发挥越来越重要的作用。然而,现有点云智能处理网络大多缺乏几何知识,很难全面有效地对三维模型特征进行概括;而且由于点云数据维数高、非结构化等特点,像在机器学习领域最新的迁移学习、图卷积网络、注意力机制、Transformer、扩散模型等技术还未能深入地应用到点云智能处理领域。本报告将介绍团队近年在大尺寸装备三维数据采集、配准、补全、去噪和表征学习等方面的工作。
|
|
报告人简介:魏明强,南京航空航天大学计算机科学与技术学院教授/太原理工大学人工智能学院院长、博士生导师、脑机智能技术教育部重点实验室副主任、江苏省智能制造工程学会常务理事、国家优秀青年科学基金获得者、江苏省计算机学会青年科技奖获得者和航空航天学会青年科学家奖获得者,及第14届Chinagraph最佳论文一等奖获得者。博士毕业于香港中文大学并获最佳博士毕业论文奖(2014)。目前为多个期刊的编委/客座编辑,如ACM TOMM、The Visual Computer、IEEE TMM。近年来,围绕大飞机3D扫描与测量、几何深度学习和三维视觉等研究方向,主持国防基础科研、国家重点研发计划子课题、国自然优青/面上/青年以及联合主持国自然重点项目等10余项;发表学术论文150余篇,如IEEE TPAMI/TVCG/TIP、SIGGRAPH、IJCV、CVPR、ICCV等CCF A类期刊和会议,相关技术用在国家重点型号工程。
|
技术论坛18:SIGGRAPH之夜 暨 从技术论文委员会(TPC)角度看SIGGRAPH |
---|
论坛简介:SIGGRAPH技术论文委员会(TPC)在论文评审阶段扮演了至关重要的角色。本论坛邀请了5位活跃在图形学领域各个方向的青年研究学者从TPC的角度来分享SIGGRAPH论文的审稿心得体会,以及课题选取、论文写作等研究经验,并与观众开展现场讨论和互动。 |
论坛主席:傅孝明,中国科学技术大学数学科学学院副教授,分别于2011、2016年在中国科学技术大学获得学士、博士学位。2016年至2021年于中国科学技术大学任特任副研究员。研究领域为计算机图形学与计算机辅助设计,研究方向为几何处理、优化、建模、制造等。已在SIGGRAPH/SIGGRAPH ASIA/ACM TOG上发表23篇论文。获2024年SMA Young Investigator Award、2023年安徽省青年数学奖、2022年入选中国科学院“青年创新促进会”。 |
论坛主席:彭思达,浙江大学软件学院“百人计划”研究员,博士生导师,启真优秀青年学者。2023年获得浙江大学计算机科学与技术博士学位。研究方向为三维计算机视觉,代表工作为EasyVolCap、Neural Body、PVNet。至今在TPAMI、CVPR、ICCV等期刊或会议发表四十余篇论文,谷歌学术引用3900余次,其中一篇一作论文获得CVPR最佳论文提名,在GitHub开源获得上万次stars。曾获得2023年全球IMC三维重建挑战赛冠军、2023年世界人工智能大会云帆奖-明日之星、2022 Apple Scholar、2020年CCF-CV学术新锐奖、2023/2021年中国CCF图形开源软件奖。
|
论坛讲者1:陈雪锦,现为中国科学技术大学信息学院特任教授,博导。分别于中国科学技术大学获得学士和博士学位。曾于耶鲁大学计算机系从事博士后研究,斯坦福大学、微软亚洲研究院任访问学者。主要研究方向为计算机图形学、三维视觉、脑显微图像分析。在ACM TOG、TMI、ICCV、NeurIPS等期刊/会议上发表学术论文80余篇,曾获CVM期刊最佳论文提名、GDC2022、ICME 3DMM Workshop2024最佳论文、ISBI挑战赛第一名等奖励。多次担任Siggraph Asia、Pacific Graphics等国际会议TPC Member。获国家教学成果二等奖、安徽省教学成果特等奖、中国图象图形学学会“石青云女科学家奖”。 |
论坛讲者2:王鹏帅,2013年和2018年分别于清华大学获得本科学位和博士学位。研究方向为计算机图形学、几何处理和三维深度学习。在学术会议SIGGRAPH(ASIA)、CVPR等上发表多篇论文,其中基于八叉树的的三维稀疏卷积的论文在2017年至2022年所有发表在SIGGRAPH (Asia) 和 ACM TOG的论文中引用量排名前5。王鹏帅博士担任著名图形学期刊Computers & Graphics的副主编、著名图形学国际会议(如SIGGRAPH Asia 2024、Eurographics 2024、CVM 2023/2024等)的会议程序委员。王鹏帅博士于2022年至2024年连续三年获得AMiner评选的AI 2000 最有影响力的学者称号,并于2023年获得亚洲图形学学会 (Asiagraphics) 青年学者奖。
|
论坛讲者3:吕琳,山东大学计算机科学与技术学院教授,博导。2011年博士毕业于香港大学,2007至2009年间于法国国家信息与自动化研究所(INRIA)访问一年。研究方向为计算机图形学、面向智能制造的几何计算,在ACM TOG、IEEE TVCG、CAD、AM等期刊发表论文八十余篇,出版专著一部,获授权国家发明专利40余项并已转化应用6项,获2017年度陆增镛CADCG高科技奖二等奖、国际实体与物理造型会议(SPM 2020)最佳论文一等奖、2020年度山东省自然科学一等奖、2021年度吴文俊人工智能自然科学奖二等奖,“计算机图形学”国家级一流本科课程等。担任第十六届全国几何设计与计算学术会议(GDC 2024)程序委员会共同主席、第十四届几何造型与处理国际会议(Geometric Modeling and Processing, GMP 2020)程序委员会共同主席、SIGGRAPH Asia 2024, Pacific Graphics 2024等会议程序委员会委员。
|
论坛讲者4:过洁,现任南京大学计算机学院、计算机软件新技术全国重点实验室长聘副教授(特聘研究员)、博导,主要研究方向为图形渲染技术。迄今为止,在国内外主流期刊和会议上发表高水平学术论文100多篇,带领团队研制国产真实感渲染引擎Moer Renderer和国产实时渲染引擎MoerEngine。相关研究成果深入应用在文物保护、基础教育、消费电子和影视娱乐等行业,服务多个企事业单位。 |
论坛讲者5:弋力,清华大学交叉信息研究院助理教授。他在斯坦福大学取得博士学位,导师为美国三院院士Leonidas J. Guibas教授,毕业后在谷歌研究院任研究科学家。他近期的研究聚焦于三维视觉与具身智能,他的研究目标是赋予机器人理解并与三维世界交互的能力。他在计算机顶级会议期刊上已发表论文六十余篇,引用数两万余次,代表作品包括ShapeNet Part,SyncSpecCNN,PointNet++等,大大影响了三维深度学习这一领域的出现与发展。此外他还曾担任CVPR、IJCAI、NeurIPS等顶会的领域主席与SIGGRAPH TPC。 |
技术论坛19:渲染与逆向渲染 |
---|
论坛召集人:王贝贝 |
---|
论坛讲者:徐昆、王璐、王贝贝、过洁、霍宇弛、陆壬淼 |
召集人简介:王贝贝,南京大学 智能科学与技术学院教授、博导。计算机图形学渲染方向,聚焦于真实感材质建模(传统+神经网络)、全局光照方法(离线+实时)、几何材质的重建和生成。曾参与Disney Infinity研发,提出实时亮片渲染方法,应用于Disney游戏中。提出SpongeCake材质模型,应用在多个引擎中。发表CCF A类期刊会议论文(ACM TOG, SIGGRAPH(Asia), TVCG, CVPR) 20余篇,入选ACM TOG亮点文章(图片)三次。担任EGSR 2025程序委员会共同主席,担任SIGGRAPH 2023-2024、EG等会议程序委员会委员。 |
报告题目:拉格朗日视角的可微渲染
|
|
报告摘要:可微渲染是近年计算机图形学和计算机视觉领域逐渐兴起的方向之一。它在生成渲染结果的同时,额外计算渲染结果关于场景参数如物体几何、材质、光照和相机参数等的导数。目前可微渲染中的一个重要问题是鲁棒性较差,特别是在初始场景和目标图像差异较大的情况下,往往无法收敛。为了解决上述问题,我们借鉴了流体模拟中的拉格朗日视角,通过从拉格朗日视角重新定义可微渲染中的导数计算方式。针对光栅化渲染 (SIGAsia 2022)、光线追踪渲染 (SIGAsia 2023)和光子映射渲染 (SIGAsia 2024)等问题,我们提出了拉格朗日视角的系列可微渲染方法,可以有效处理长距离影响和复杂光路情形,显著提升了可微渲染的鲁棒性和收敛性。 | |
报告人简介:徐昆,清华大学计算机系长聘副教授、博导,国家优秀青年基金获得者。研究兴趣包括计算机图形学,真实感绘制和智能媒体计算。在ACM SIGGRAPH, ACM TOG, IEEE TVCG等重要会议期刊发表论文40余篇。担任Computers & Graphics编委,曾担任国际会议Pacific Graphics程序委员会共同主席(2015年)。获国家自然科学奖二等奖一项(排名4),国家科技进步奖二等奖一项(排名4),中国计算机学会优秀博士学位论文奖,入选中国科协“青年人才托举工程”。 |
报告题目:大规模场景和复杂场景高效渲染技术
|
|
报告摘要:大规模场景和复杂场景渲染面临着严峻的存储和计算瓶颈,如何在保持渲染真实感的同时,提升复杂场景的渲染效率成为数字孪生、元宇宙等领域迫切需要解决的问题。我们基于场景实例化对象的神经表示提出大规模场景分布式渲染方法,在解决存储瓶颈的同时,实现光路的有效调度,可高效渲染100GB以上场景;进而,提出复杂光源的神经表示方法,在有效呈现光源表观的同时,实现复杂灯具快速照亮场景的目标;此外,依据材质的规律性和重复性特征,提出基于材质基元和材质神经表示的高效渲染方法,仅需采用极少的存储即可实现布料、划痕金属等复杂材质的实时渲染。
|
|
报告人简介:王璐,山东大学软件学院教授、博导。研究兴趣包括计算机图形学、真实感渲染、人机交互和虚拟现实。在ACM SIGGRAPH, ACM TOG, IEEE TVCG等期刊和会议上发表论文40余篇。所研发的“RWing高度真实感并行渲染系统”是国产高性能计算机“神威·太湖之光”十大典型应用之一。相关研究成果应用在影视动漫、工业设计、数字孪生等领域。 |
报告题目:材质的真实感建模与逆向恢复 |
|
报告摘要:现实世界是丰富多彩的,包括了丰富的几何、多彩的外观和斑斓的光影。在自动驾驶、工业设计等应用中通常需要为现实世界构建真实感的三维数字世界,一方面需要获取物理世界中的几何和材质,另一方面也需要真实地模拟光线与材质的交互。本次报告中将介绍近两年团队在几何/材质获取、材质建模方面的相关工作。
|
|
报告人简介:王贝贝,南京大学智能科学与技术学院教授、博导。计算机图形学渲染方向,聚焦于真实感材质建模(传统+神经网络)、全局光照方法(离线+实时)、几何材质的重建和生成。曾参与Disney Infinity研发,提出实时亮片渲染方法,应用于Disney游戏中。提出SpongeCake材质模型,应用在多个引擎中。发表CCF A类期刊会议论文(ACM TOG, SIGGRAPH(Asia), TVCG, CVPR) 20余篇,入选ACM TOG亮点文章(图片)三次。担任第36届EGSR程序委员会共同主席,担任SIGGRAPH 2023-2024、EG等会议程序委员会委员。
|
报告题目:真实感镜面散射场景高效渲染技术 |
|
报告摘要:现代真实感渲染方法大多都依赖于随机采样(即蒙特卡洛技术),而镜面散射(镜面反射和镜面折射)场景因其采样空间存在大量的奇点和不连续性,导致采样效率异常低。尤其是当镜面反射/折射路径变长之后,这种低效采样问题变得愈发严重。本报告将汇报我们在真实感镜面散射场景高效渲染方面的一些近期工作,探索如何缓解镜面散射场景采样低效的问题。 | |
报告人简介:过洁,现任南京大学计算机学院、计算机软件新技术全国重点实验室长聘副教授(特聘研究员)、博导,主要研究方向为图形渲染技术。迄今为止,在国内外主流期刊和会议上发表高水平学术论文100多篇,带领团队研制国产真实感渲染引擎Moer Renderer和国产实时渲染引擎MoerEngine。相关研究成果深入应用在文物保护、基础教育、消费电子和影视娱乐等行业,服务多个企事业单位。 |
报告题目:可泛化和高动态的全局神经绘制技术 |
|
报告摘要:绘制研究的一个核心问题是如何仿真模拟光线在场景中的传播过程,从而实现高逼真的视觉效果。借助近年来飞速发展的深度学习技术,绘制过程的模拟、以及绘制结果的改进上,取得了很大的进展。虽然神经绘制技术有效提升了光照计算效率与绘制质量,但是在动态几何和和可泛化场景这两个问题上还存在重大挑战。本报告介绍我们在可泛化和全动态的全局神经绘制以及流水线技术上的一些新进展。 | |
报告人简介:霍宇驰,浙江大学CAD&CG实验室百人计划研究员,围绕光能传输开展计算机图形学、计算机视觉、计算光学等研究工作,当前的研究题目包括真实感绘制、实时绘制、神经绘制、三维重建、光学神经网络等,在Nature Communications、SIGGRAPH、CVPR、NIPS等相关领域的顶刊顶会上已发表30余篇工作,并应用于华为、酷家乐、光线云等企业的平台,获得启真优秀青年学者,陆增镛CAD&CG高科技奖、浙大信息学部青年创新奖等。 |
报告题目:移动GPU架构面临的问题和思考 |
|
报告摘要:GPU以兼顾灵活性和并行处理的强大能力,服务于各行各业,尤其使得实时渲染成为现实;移动GPU在提供上述能力的基础上,对功耗非常敏感,所以在架构上也要围绕降功耗来设计,其中的重点是降低访存的带宽和遮挡剔除。 | |
报告人简介:陆壬淼,GPU 技术专家、10年GPU领域从业经验,包括DDK软件架构设计和GPU硬件架构设计,聚焦移动GPU架构面临的问题和解决思路。 |