Arvin

发表于2024-11-09|更新于2024-11-09|Others|Ubuntu20.04•Windows10

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：Ubuntu20.04和Windows系统安装教程 vectory系统盘制作官方链接 Ubuntu安装教程软件安装搜狗拼音参考链接： Ubuntu20.04安装搜狗输入法安装fcitx 12sudo apt install fcitx-binsudo apt-get install fcitx-table 下载搜狗安装包搜狗输入法官网安装依赖 12sudo apt install libqt5qml5 libqt5quick5 libqt5quickwidgets5 qml-module-qtquick2sudo apt install libgsettings-qt1 安装搜狗 12cd ~/Downloads/sudo dpkg -i sogoupinyin_4.2.1.2800_x86_64.deb # 依照自己的文件名字确定切换fcitx 在系统设置Settings中选择region and languages，点击Manege installed language。先把下 ...

草稿

发表于2024-11-09|更新于2024-11-09|Others|Ubuntu20.04•Windows10

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：Ubuntu20.04和Windows系统安装教程周记决策过程（笔记）决策过程的概念马尔可夫决策过程 safe RL 将驾驶过程近似为马尔科夫过程，即下个状态只与当前状态有关系。主要贡献： **证明马尔科夫假设在策略梯度法中的不必要性；**使用策略梯度迭代的方法求解最优策略；使用baseline subtraction的方法，最小化对累积奖励估计的方差。将问题分解为两个组成部分：一个是"Desires"策略，需要学习；而是带有硬约束的轨迹规划，不需要学习。“Desires”策略提高了驾驶的舒适性，轨迹规划的硬约束保证了驾驶的安全性；引入有向无环图，即状态集。 MPDM: Multipolicy Decision-Making 多策略决策将车辆行为建模成合理、安全的策略以减少不确定性；通过前向模拟考虑周车对自身的影响；评估不同策略下的模拟结果，选择最优的策略；待解决问题：周车的策略生命周期后验更新组合爆炸，关键场景不确定性感知的决策过程 POMDP部分可观 ...

自动驾驶预测与决策规划（三）

发表于2024-04-08|更新于2024-04-08|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院自动驾驶预测与决策规划学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。时空联合规划传统的时空分离规划只考虑了路径规划和速度规划，分别对应横向控制和纵向控制。而时空联合规划算法则同时考虑空间和时间来规划轨迹，在路径基础上再求解速度从而形成轨迹，能够能直接在x−y−tx-y-tx−y−t（即平面和时间）三个维度的空间中直接求解最优轨迹。时空分离规划：时空联合规划：基于搜索（Hybrid A*）的时空联合规划方法构建三维时空联合规划地图构建二维栅格地图二维x-y栅格地图只具有几何属性，无法直接搜索带有时间属性的可行驶轨迹。（灰色圆形区域部分：在最大转向角下也会发生碰撞或不可能到达目的地；半径大小：最小转弯半径；方向：车速方向相切；）沿时间轴扩展生成三维时空地图如下图所示，多个地图层相互平行；相邻图层中的两个状态根据时间步长由有向边相连；蓝色有向边连接的点序列表示以Δt\Delta tΔt为时间步长离散化的时空轨迹； ...

自动驾驶预测与决策规划（二）

发表于2024-03-20|更新于2024-03-20|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院自动驾驶预测与决策规划学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。规划算法（笔记）路径与轨迹规划（笔记）基于搜索的路径规划 Hybrid A*算法节点的拓展基于车辆运动学模型代价的计算基于栅格栏代价计算代价包括节点遍历代价和两个启发函数，即F(n)=g(n)+h1(n)+h2(n)F(n)=g(n)+h_1(n)+h_2(n)F(n)=g(n)+h1(n)+h2(n)，其中 g(n)g(n)g(n)主要考虑路径长度、运动学约束、方向变换成本; h1(n)h_1(n)h1(n)只考虑车辆的运动学约束而不考虑障碍物; h2(n)h_2(n)h2(n)只考虑障碍物信息而不考虑车辆的运动学约束; 基于采样的路径规划 Frenet坐标系 Werling M , Ziegler J , Kammel S , et al. Optimal Trajectory Generation for Dynamic Street Scenarios ...

自动驾驶预测与决策规划（一）

发表于2024-03-10|更新于2024-03-10|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院自动驾驶预测与决策规划学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。自动驾驶决策规划简介实验准备下载nuplan-devkit 在终端中进入希望的安装目录，以主目录为例，运行代码拉取命令： 12cd ~git clone https://github.com/motional/nuplan-devkit.git 安装miniconda 在终端中输入以下命令下载miniconda安装包： 12cd ~wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh 运行安装包，安装过程中按照指示一直按enter和选择yes即可： 1bash Miniconda3-latest-Linux-x86_64.sh conda全局初始化将conda的环境路径添加到用户目录的.bashrc文件中，终端每次启动时执行.bashrc添加conda的环境路径，初始化后重新启动终端即可使用c ...

机器人中的数值优化（五）

发表于2024-03-02|更新于2024-03-02|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院机器人中的数值优化学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。附录(笔记) 函数的光滑技巧 Inf convolution卷积 Inf convolution 卷积操作适应于凸函数，Inf convolution 卷积操作的目标是把不光滑的凸函数进行光滑近似，并使得光滑近似后的函数于原函数尽量吻合。对于两个凸函数f1，f2f_1， f_2f1，f2，它们之间的Inf convolution 卷积操作记为f1□f2f_1\Box f_2f1□f2，即找一个u1u_1u1和u2u_2u2，满足u1+u2=xu_1+u_2=xu1+u2=x的条件下，使得f1(u1)+f2(u2)f_1(u_1)+f_2(u_2)f1(u1)+f2(u2)最大或最小，如下面的第一个表达式所示，由于满足u1+u2=xu_1+u_2=xu1+u2=x，因此可消去一个uuu进行简化，简化后的表达式如下面第二个式子所示： (f1□f2)(x)=inf⁡(u1 ...

机器人中的数值优化（四）

发表于2024-02-26|更新于2024-02-26|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院机器人中的数值优化学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。锥规划（笔记）锥和对称锥尖锥如果一组点κ⊆Rn\kappa\subseteq\mathbb{R}^nκ⊆Rn满足以下条件，则称为尖锥： Conic:a∈K,λ≥0⇒λa∈KPointed:a∈K and −a∈K⇒a=0\begin{aligned}&{\text{Conic:}\quad a\in\mathcal{K},\lambda\geq0\Rightarrow\lambda a\in\mathcal{K}}\\&{\text{Pointed:}\quad a\in\mathcal{K}\mathrm{~and~}-a\in\mathcal{K}\Rightarrow a=0}\end{aligned} Conic:a∈K,λ≥0⇒λa∈KPointed:a∈K and −a∈K⇒a=0 第一个条件即向量aaa在集合K\mathcal{K}K中，λ≥0\lambd ...

机器人中的数值优化（三）

发表于2024-02-20|更新于2024-02-20|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院机器人中的数值优化学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。有约束优化（笔记）分类低维线性规划（LP）目标函数： f(x1,x2…xd)=c1x1+c2x2+⋯+cdxdf(x_1,x_2\ldots x_d)=c_1x_1+c_2x_2+\cdots+c_dx_d f(x1,x2…xd)=c1x1+c2x2+⋯+cdxd 约束： a1,1x1+⋯+a1,dxd⩽b1a2,1x1+⋯+a2,dxd⩽b2an,1x1+⋯+an,dxd⩽bn\begin{array}{l} a_{1,1} x_{1}+\cdots+a_{1, d} x_{d} \leqslant b_{1} \\ a_{2,1} x_{1}+\cdots+a_{2, d} x_{d} \leqslant b_{2} \\ a_{n, 1} x_{1}+\cdots+a_{n, d} x_{d} \leqslant b_{n} \\ \end{array} a1,1 ...

机器人中的数值优化（二）

发表于2024-01-15|更新于2024-01-15|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院机器人中的数值优化学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。无约束优化拟牛顿法为什么要用拟牛顿法？一般情况下，当函数为曲线平滑的凸函数时，我们使用牛顿法。牛顿法如下：通过二阶泰勒展开： f(x)≈f^(x)≜f(xk)+∇f(xk)T(x−xk)+12(x−xk)T∇2f(xk)(x−xk)(1)f(\boldsymbol{x})\approx\hat{f}\left(\boldsymbol{x}\right)\triangleq f(\boldsymbol{x}_k)+\nabla f(\boldsymbol{x}_k)^T(\boldsymbol{x}-\boldsymbol{x}_k)+\frac12(\boldsymbol{x}-\boldsymbol{x}_k)^T\nabla^2f(\boldsymbol{x}_k)(\boldsymbol{x}-\boldsymbol{x}_k) \tag{1} f(x)≈f^(x)≜f(xk) ...

机器人中的数值优化（一）

发表于2024-01-10|更新于2024-01-10|Math|Optimization

文档维护：Arvin 网页部署：Arvin ▶ 写在前面：本文内容是作者在深蓝学院机器人中的数值优化学习时的笔记，作者按照自己的理解进行了记录，如果有错误的地方还请执政。如涉侵权，请联系删除。凸优化基础最优化问题概括最优化问题一般可以描述为： min⁡f(x)s.t.g(x)≤0h(x)=0\begin{array}{rl}\min&f(x)\\\mathrm{s.t.}&g(x)\leq0\\&h(x)=0\end{array} mins.t.f(x)g(x)≤0h(x)=0 凸集合与凸函数凸集对于Rn\mathbb{R}^{n}Rn中的两个点x1≠x2x_{1}\ne x_{2}x1=x2，形如y=θx1+(1−θ)x2y=\theta x_{1}+(1-\theta) x_{2}y=θx1+(1−θ)x2的点形成了过点x1x_{1}x1和x2x_{2}x2的直线。当0≤θ≤10\le \theta \le10≤θ≤1，这样的点形成了连接点的x1x_{1}x1和x2x_{2}x2的线段。定义：如果过集合C中任意两点的直线都 ...