Pytorch深度學習入門,介紹強化學習框架,ReinforcementLear技術在系統控制環節中的作用,各類強化學習模型的實戰應用,提升職業技能。
計算機相關專業專科本科在校生,或理工科本科,且至少熟悉一門編程語言;
Java 開發工程師、機器學習工程師、機器學習開發工程師、機器學習算法工程師、 數據科學家、人工智能工程師、人工智能應用工程師、人工智能應用開發工程師、應用架構高級工程師、人工智能產品經理;
通過實戰案例的講解,使學員了解強化學習和深度學習(Pytorch)的知識和技能。
— 初識深度學習;
— 強化學習部分;
學習內容
初識深度學習
概念與術語(人工智能、強化學習、深度學習)
Python環境安裝
什么是RL
如果準備Pytorch環境
Window或linux環境下的準備工作
實現第一個神經網絡,詳解神經網絡的組成部分
向量化,值歸一化
處理缺失值,過擬合與欠擬合
權重正則化,Dropout使用
強化學習部分
什么是MDP 馬科夫決策過程
如何進行動態編程
蒙特卡洛方法
連續狀態過程
N步-Bootstrap
強化學習和神經網絡的整合
Deep Sarsa過程
Deep Q-learning
高級Actor-Critic A2C的使用
無認證考試
暫無開班信息
人工智能訓練師(三級)進階
隨著人工智能技術的快速發展,社會對相關專業人才的需求不斷增加。上海交通大學憑借其在人工智能領域的學科優勢和科研實力,開展人工智能訓練師培訓項目,旨在培養適應市場需求的專業技術人才。
開課時間:暫無
人工智能訓練師(三級)基礎
隨著人工智能技術的快速發展,社會對相關專業人才的需求不斷增加。上海交通大學憑借其在人工智能領域的學科優勢和科研實力,開展人工智能訓練師培訓項目,旨在培養適應市場需求的專業技術人才。
開課時間:暫無
DeepSeek核心技術原理和本地部署微調實戰
隨著人工智能技術的快速發展,智能助手(如DeepSeek-V3)在多模態理解、個性化交互、知識推理等領域的應用日益廣泛。DeepSeek-V3作為深度求索公司推出的第三代智能助手,憑借其先進的核心技術(如大規模預訓練、多模態理解、上下文感知等),在智能客服、內容創作、教育、醫療等領域展現了強大的潛力。
開課時間:暫無