模仿学习和强化学习,最近大家智驾圈听的最多的是强化学习了。以我有限的知识,了解到,强化学习属于性价比特别高的,有用,但不是万能的,也有负面,就是遇到强化学习训练特别多的场景,模型知道哪些是错的,他不会犯低级错误,但是如何正确的走,他也不清楚了,容易犯懵,因为强化太猛,导致模型以为干啥都是错的。
所以,遇到一些场景,你发现智驾只会很墨迹的走,基本就是强化过头了。模型不知道如何正确的走,只会乌龟爬了。
模仿学习训练起来,就是成本高。
以上仅为个人浅见,欢迎大佬指正。
模仿学习和强化学习,最近大家智驾圈听的最多的是强化学习了。以我有限的知识,了解到,强化学习属于性价比特别高的,有用,但不是万能的,也有负面,就是遇到强化学习训练特别多的场景,模型知道哪些是错的,他不会犯低级错误,但是如何正确的走,他也不清楚了,容易犯懵,因为强化太猛,导致模型以为干啥都是错的。
所以,遇到一些场景,你发现智驾只会很墨迹的走,基本就是强化过头了。模型不知道如何正确的走,只会乌龟爬了。
模仿学习训练起来,就是成本高。
以上仅为个人浅见,欢迎大佬指正。