赵婷婷
姓名: 赵婷婷
职称/职务:教授/硕士生导师
电子邮箱:tingting@tust.edu.cn
办公地点:滨海校区西院8-312
研究方向:1.机器学习及智能信息处理,包括深度强化学习
2.智能控制及智慧医疗方面的应用
讲授课程:《机器学习》(本科生);《人工智能与神经网络》(硕士研究生)
个人基本情况:
赵婷婷,教授,硕士生导师,日本东京工业大学(Tokyo Institute of Technology)博士。天津市“131”第二层次人选及“中青年骨干创新人才培养计划”人选。主持承担国家自然科学基金面上项目、国家自然科学青年基金、教育部留学回国人员科研启动基金项目等纵向项目6项。近年来撰写专著1部,在机器学习领域发表论文45余篇,其中包括顶级国际期刊Neural Networks、Neural Computation及顶级国际会议论文NeurIPS、 IJCAI、ACML及ECML/PKDD。拥有核心专利,其中授权专利15项。产学研成果获山西省科学技术奖科技进步奖二等奖、中国商业联合会服务业科技创新奖一等奖、天津市科技进步三等奖、中国轻工业联合会技术进步奖、中国商业联合会科技进步奖三等奖等。主要研究领域为机器学习及智能信息处理,其中主要包括深度强化学习算法,智能控制及智慧医疗方面的应用。
工作履历:
Ø 2024.01-至今,天津科技大学,教授
Ø 2023/07 - 2025/03,日本理化学研究所先进智能研究中心,访问学者
Ø 2014/11 – 2023.12,天津科技大学,副教授
Ø 2014/03 - 2014/11,天津科技大学,讲师
教育背景:
Ø 2011/04 - 2014/03,东京工业大学(日本),计算机科学专业,博士
Ø 2007/09 - 2009/12,大连理工大学,信号与信息处理专业,硕士
Ø 2003/09 - 2007/07,大连民族学院,电子信息工程专业,学士
主要科研项目:
1.纵向课题:国家自然科学基金面上项目,61976156,强化学习中基于潜在空间的高效策略搜索方法的研究,72万,2020/01-2023/12,主持。
2.纵向课题:国家自然科学基金,61502339,针对大规模环境下复杂任务的策略搜索强化学习方法研究,22.9万,2016/01-2018/12,主持。
3.纵向课题:教育部留学回国人员科研启动基金,引导型策略搜索强化学习算法及其在数字艺术中的体现,3.5万,2015/05-2017/-04,主持。
4.纵向课题:天津市高等学校基本科研业务费资助项目一般项目,深度策略搜索强化学习方法的研究,2017KJ034 ,6万,2017/06-2020/06,主持。
5.横向项目:2023年9月成功签订80万横向重大科研项目,已到账30万。结合智能信息处理与推荐技术为企业设计智慧学习平台,80万,2023.09-2024.06,主持。
6.成果转换:2021年5月,一种面向大规模环境中复杂任务的深度策略学习方法,深圳市安软科技股份有限公司,2.5万,主持。
代表性论文:
1.Tingting Zhao, Ying Wang, Wei Sun, Yarui Chen*, Gang Niu, Masashi Sugiyama. Representation learning for continuous action spaces is beneficial for efficient policy learning. Neural Networks,2023,159 : 137–152. (JCR 1区TOP,影响因子7.8)
2.Tingting Zhao∗, Guixi Li, Yajing Song, Yuan Wang, Yarui Chen, Jucheng Yang. A multi-scenario text generation method based on meta reinforcement learning. Pattern Recognition Letters, 2023,165: 47–54. (JCR 2区,影响因子5.1)
3.Tingting Zhao, YingWang,Guixi Li,LeKong,Yarui Chen,Yuan Wang,NingXie,JuchengYang. A model-based reinforcement learning method based on conditional generative adversarial network. Pattern Recognition Letters, 2021,152: 18-25. (JCR 2区,影响因子5.1)
4.Tingting Zhao, Shuai Wu, Guixi Li, Yarui Chen, Gang Niu, Masashi Sugiyama. Learning intention-aware policies in deep reinforcement learning, Neural Computation, 2023(35), 1657–1677 .(JCR 3区,影响因子2.9)
5.Ning Xie, Jengtao Shen, and Tingting Zhao*.Stroke-based stylization by learning sequential drawing examples. Journal of Visual Communication and Image Representation, 51:29-39,2018. (JCR 2区,影响因子2.6)
6.Tingting Zhao, H. Hachiya, G. Niu and M. Sugiyama. Analysis and improvement of policy gradient estimation. Advances in Neural Information Proceeding System (NeurIPS 2011), pp.262-270, 2011. (CCF- A类会议)
7.Ning Xie, Tingting Zhao*, Feng Tian, Xiaohua Zhang, Masashi Sugiyama. Stroke-based stylization learning and rendering with inverse reinforcement learning. In Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence (IJCAI 2015), pp.2531-2537, Buenos Aires, Argentina, Jul. 25-31, 2015.(CCF- A类会议)
8.Tingting Zhao*, G. Niu, N. Xie, J. Yang and M. Sugiyama. Regularized policy gradients: Direct variance reduction in policy gradient estimation. Proceedings of the 7th Asian Conference on Machine Learning (ACML 2015),vol.45, pp.333-348, Hong Kong, China, Nov. 20-22, 2015. (CCF-C类会议)
9.陈亚瑞,杨巨成,史艳翠,王嫄,赵婷婷*.概率生成模型变分推理方法综述[J/OL].计算机研究与发展:1-16[2021-12-09].(CCF推荐中文 A类期刊,计算机三大期刊之一,EI检索)
10.赵婷婷*,孙威,陈亚瑞,王嫄,杨巨成. 潜在空间中深度强化学习方法研究综述[J].计算机科学与探索.2023,17(9):2047-2074.(CCF推荐中文 B类期刊)
著作:
1.学术专著:统计策略搜索强化学习方法及应用.赵婷婷.电子工业出版社,2021.08.
专利:
1.赵婷婷、杨巨成、赵希、任德华、陈亚瑞、房珊珊. 一种面向大规模环境中复杂任务的深度策略学习方法,专利授权号:ZL201610398668.5
2.赵婷婷、宋亚静、王嫄、任德华、杨巨成.一种基于元强化学习的文本生成方法,专利授权号:202010156433.1
招生专业:
学科1:软件工程;研究方向:软件工程技术
学科2:电子信息(专硕);研究方向:人工智能