三维重建技术框架技术模型和技术细节原理详解.pdf

下载文档

14
0
约2.54千字
约 37页
2022-10-07 发布于四川
举报
版权申诉
保障服务

三维重建技术框架技术模型和技术细节原理详解.pdf

1、本文档共37页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

应用领域概述应用领域概述应用领域概述应用领域概述原型设计虚拟现实机械手臂辅助驾驶定位与追踪如何三维重建？人工，软件等方法慢慢磨（那是相当的慢啊）如何三维重建？激光雷达等获取深度与3维信息（这个可贼拉贵）如何三维重建？使用各个视角图像进行三维重建（这个便宜还容易）相机成像这件事有几百年了！为啥需要小孔成像？没有小孔，同一点会落很多整体概述：(Truncated Signed Distance Function) f就是焦距，o就是光圈；右图为光圈大小对清晰度的影响相机坐标系与像平面坐标系空间点p在图像中哪呢？要得到其映射关系（通过相似三角形，将摄像机坐标系P->像平面坐标系p’）像素坐标系注意偏置(像素不是以中心开始) （看你设备咋样0.01m/像素）注意还需要转换单位：线性？对应关系是线性的？（例如两个坐标系X的对应，其中α固定，但是Z呢？）（X变了，Z大概率也变了）如何解决这个问题呢？（如果非线性的，那就很难转换了）使用齐次坐标来完成这个任务齐次坐标齐次坐标变换：其实就是增加一个维度，欧氏空间->齐次空间在变换回来：坐标转换齐次坐标中的转换（就是为了得到变换矩阵，且这个矩阵是不变的）摄像机内参K 表示空间点到图像中的对应关系相机本身参数，固定的后续项目中数据集会给出内参也是三维重建中必须知道的一个指标任何定义物体的位置呢？你往左，我往右会撞上吗？这个就需要世界坐标系了来捋一捋咱们现在有3个坐标系了现在还得想办法怎么转换世界坐标世界坐标系与相机坐标系世界->相机，需要一个旋转平移矩阵：其中R是3*3矩阵，T是3*1矩阵（X,Y,Z三个方向），RT就是摄像机位姿坐标系变换像素与世界坐标系的关系（其实需要我们知道内外参就可以映射）像素坐标系->相机坐标系->世界坐标系的对应：相机标定要做一件什么事呢？就是求解相机的内外参数那你就得告诉我像素坐标和世界坐标，才能求解中间的参数相机标定就是利用多组对应位置，如上图，来求解相机内外参数的过程相机标定商汤：NeuralRecon 矛盾点：落地所需的设备高端的食材咋地都好吃但很多应用要集成到普通摄像头中 NeuralRecon就是单目解决方案传统任务流程输入序列选择，深度估计，点云，融合你能确定每一步都做的准嘛？可能遇到的问题深度估计结果尺度不一致：各自为政，想玩到一块不容易重复的计算非常多，输入序列中肯定很多位置重复了每个位置都要取计算它的深度信息，速度大打折扣 NeuralRecon要做的事一句话总结就是：擒贼先擒王，省略掉中间过程，直接预测想要的中间过程就相当于深度信息，点云信息等统统不需要，直接输出结果那中间的事谁管呢？爱谁谁吧，交给神经网络就得了既不用高端设备，也不计算中间结果，直接End2End的一个框架整体框架 1.关键帧选择；2.输入序列(9张图) ；3.片段重建；4.全局合成核心就是中间的网络，如何利用图像信息估计TSDF值 NeuralRecon框架核心就是特征映射，如何将图像中的特征映射到重建的结果上其实就是通过相机的内外参将像素坐标系与世界坐标系对应映射细节例如输入特征图：40*40*80 体素一共有1W个小方块