UCL的"Comp0124 多代理人人工智能"模块介绍了多代理机器学习,这是人工智能(AI)的一个子领域。多代理学习发生在多个智能计算机代理相互作用的领域,这些代理不仅与环境交互,还与彼此交互。 应用范围从控制一群自动驾驶汽车/无人机到协调工厂和仓库中的协作机器人,再到优化分布式传感器网络/流量和电子商务和金融市场中的机器竞标。 该模块将机器学习研究与博弈论和经济学研究相结合,涵盖博弈论、拍卖理论、算法机制设计和多代理(深度)强化学习等主题。 还将涵盖和讨论实际应用,包括在线广告、在线拍卖、对抗性生成模型的训练、机器人规划和在线游戏中的AI代理。
成功完成该模块后,学生将能够:
掌握该模块的理论和实践方面。
了解多方决策的基本原则和理论,以及学习算法,以实现最佳决策或在不同目标之间取得平衡。
利用所学的理论和算法来制定和解决具有多个目标/激励措施的大规模实践学习问题。
学生将能够:
掌握该模块的理论和实践方面。
了解多方决策的基本原则和理论,以及学习算法,以实现最佳决策或在不同目标之间取得平衡。
利用所学的理论和算法来制定和解决具有多个目标/激励措施的大规模实践学习问题。
该模块通常涵盖以下主题:
博弈论和在线拍卖:囚徒困境、主导策略、纳什均衡、混合策略和帕累托最优性。
重复游戏中的学习:线性编程解和Lemke-Howson算法。
单一代理强化学习:价值迭代、策略迭代、Q学习、策略梯度和深度强化学习。
多代理强化学习:随机博弈、NASH-Q、梯度上升、狼和平均场Q学习。
应用:在线广告竞标、在线游戏中的AI代理以及与机器人合作学习。
要选择此模块作为选修课或选修课,学生必须:
在正式提供此模块的课程和学年中注册。
具备Python/Java的强大编程能力(需要至少一个过去的编程项目的证据)。
具备较强的概率和统计能力。
具备机器学习和深度学习方法和算法的知识,例如分类、回归和聚类(需要至少一个过去的编程项目,使用TensorFlow、PyTorch、MXNET或类似的深度学习框架的证据)。
选择DR.D留学生辅导机构,让我们携手开启留学之旅,为您的留学生活增添精彩!
严格按照学校要求完成,从审阅资料到论文代写交稿严格把关,100%原创论文,TurnitinUK查重检测,E-convier向您做无抄袭担保!
论文导师24小时待命,严格审核订单时间,100%确保在约定时限前交付,专业的客服体系,保证随叫随到,保证及时修改
E-convier超过1800名英语母语professional writers,其中95%是英国本地导师,并具有Maste或者PhD以上学位
E-convier为了保护您的个人信息和论文安全,所有资料全部通过银行级SSL256数据加密,永远做到让您高枕无忧
E-convier论文代写,2008年创办,10年知名品牌!
论文定制只需三步——随时随地管理您的订单!