个人简介Personal Profile
唐申庚,讲师,硕士生导师,安徽省人工智能学会计算机视觉专委会秘书长。研究方向包括手语翻译与生成、视频理解与分析、跨媒体智能推理。2017年本科毕业于湖南师范大学计算机科学与技术专业;2017年至2022年期间,在合肥工业大学计算机应用技术专业硕博连读(导师:洪日昌教授),2022年12月获得工学博士学位。2023年2月起在合肥工业大学计算机与信息学院任讲师。
目前已在ACM MM、IJCAI、IEEE TIP、IEEE TMM等CCF A类会议及IEEE/ACM Trans.期刊上发表论文6篇,参与撰写英文学术专著1项,申请中国发明专利7项(其中授权4项、实审3项),登记软件著作权3项。参与国家自然科学基金重点项目1项、面上项目2项,担任CVPR, ICCV, AAAI, ACM MM,ACM CHI,ECCV, ACCV,IEEE TMM, IEEE TCSVT, ACM TOMM, CVIU,Neural Networks,Neurocomputing等国际期刊与会议审稿人。
目前所在团队为合肥工业大学计算机与信息学院(人工智能学院)媒体计算实验室(Laboratory of Multimedia Computing, LMC)。欢迎了解和关注媒体计算实验室计算机视觉研究小组(小组主页:https://vut-hfut.github.io/),本团队研究方向包括模式识别与人工智能、计算机视觉理解与生成、多媒体分析与跨媒体推理等,团队常年招收和培养博士研究生、硕士研究生及本科生,欢迎志同道合的小伙伴们加入!(联系邮箱:tangsg@hfut.edu.cn,QQ:1028783685)
代表性成果:
论文:
[1] Dan Guo,Shengeng Tang, and Meng Wang, "Connectionist Temporal Modeling of Video and Language: a Joint Model for Translation and Sign Labeling",International Joint Conference on Artificial Intelligence (IJCAI), 2019: 751-757. [Link][PDF][BibTeX]
[2]Shengeng Tang, Dan Guo, Richang Hong, and Meng Wang, "Graph-Based Multimodal Sequential Embedding for Sign Language Translation",IEEE Transactions on Multimedia (TMM), 2022, 24: 4433-4445. [Link][PDF][BibTeX]
[3]Shengeng Tang, Richang Hong, Dan Guo, and Meng Wang, "Gloss Semantic-Enhanced Network with Online Back-Translation for Sign Language Production",ACM International Conference on Multimedia (ACM MM), 2022: 5630-5638. [Link][PDF][BibTeX]
[4]Peipei Song, Dan Guo, Xun Yang,Shengeng Tang, Erkun Yang, and Meng Wang, "Emotion-Prior Awareness Network for Emotional Video Captioning",ACM International Conference on Multimedia (ACM MM), 2023: 589-600. [Link][PDF][BibTeX]
[5]Peipei Song, Dan Guo, Xun Yang,Shengeng Tang, and Meng Wang, "Emotional Video Captioning with Vision-based Emotion Interpretation Network",IEEE Transactions on Image Processing (TIP), 2024, 33: 1122-1135.[Link][PDF][BibTeX]
[6]Shengeng Tang, Feng Xue, Jingjing Wu, Shuo Wang, and Richang Hong, "Gloss-driven Conditional Diffusion Models for Sign Language Production",ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2024.[Link][PDF][BibTeX]
著作:
[1]Dan Guo,Shengeng Tang, Richang Hong, and Meng Wang, "Sign Language Recognition",Multimedia for Accessible Human Computer Interfaces. Springer, Cham, 2021: 23-59. [Link][PDF][BibTeX]
专利:
[1]郭丹;唐申庚; 刘祥龙; 洪日昌; 汪萌; 一种基于图卷积的多模态融合手语识别系统及方法, 2023-3-14, 中国, ZL202010049714.7. (授权)
[2]郭丹;唐申庚; 刘祥龙; 汪萌; 一种基于多层次语义解析的手语翻译系统及方法, 2023-3-28, 中国, ZL202010103960.6. (授权)
[3]郭丹; 谷纪豪;唐申庚; 肖同欢; 曹晨曦; 宋万强; 一种基于深度智能交互的室外视障辅助方法, 2022-4-11, 中国, ZL202210371804.7. (授权)
[4]郭丹; 曹晨曦; 肖同欢;唐申庚; 谷纪豪; 黄滨; 一种基于语义分割的择优式方向偏移预警系统和方法, 2022-4-11, 中国, ZL202210374860.6. (授权)
[5]郭丹; 刘泽宽; 郭义臣;唐申庚; 武梓龙; 文则涵; 陈颖男; 一种基于深度学习的WiFi手语翻译系统及方法, 2022-7-8, 中国, CN202210805408.0. (实审)
[6]唐申庚; 肖同欢; 郭丹; 谷纪豪; 曹晨曦; 宋万强; 黄滨; 一种基于图像目标检测和视觉深度估计的碰撞预警方法, 2023-2-27, 中国, CN202310188292.5. (实审)
[7]唐申庚; 宋万强; 郭丹; 黄滨; 谷纪豪; 肖同欢; 曹晨曦; 一种基于带权无向图的视障人士路线规划方法, 2023-3-6, 中国, CN202310228006.3. (实审)
软著:
[1]郭丹;唐申庚; 陈颖男; 武梓龙; 文则涵; 刘泽宽; 基于关键点估计的人体姿态卡通化系统 V1.0, 2022SR0771364, 原始取得, 全部权利, 2022-06-16.
[2]唐申庚; 黄滨; 郭丹; 谷纪豪; 盲人避障出行辅助系统 V1.0, 2023SR0517944, 原始取得, 全部权利, 2023-05-05.
[3]唐申庚; 修雪玉; 郭丹; 董晓虎; 姚骏; 谢伟豪; 跨语言手语翻译系统 V1.0, 2023SR1107827, 原始取得, 全部权利, 2023-09-20.