ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 자율주행을 위한 데이터 파이프라인 구축 비결 좋구만
    카테고리 없음 2020. 2. 28. 03:17

    >


    이번에는 테스트 및 연구차량에서 데이터를 수집하기 위한 접근법과 프로세스 모드에 걸쳐 데이터 요구를 충족하기 위한 적절한 데이터 파이프라인을 구축하는 비법을 탐구합니다.​, 자율 주행 도전 ​, 많은 기업들은 앞서고 Level 4자율 주행과 그 이상을 위한 토대로서 점점 정교한 운전자 지원 시스템(Advanced Driver Assistance System, ADAS)을 공급하고 있습니다.


    >


    자율주행차(AV) 개발 프로젝트는, 상당한 데이터 과제에 직면하고 있습니다. R&D를 위해 배치된 차량들은 산더미 같은 데이터를 발생한다.현장에서 차로 데이터를 효율적으로 이동하여 심층 신경망(Deep Neural Networks, DNN)을 훈련할 수 있는 파이프라인을 어떻게 구축합니까?·DNN 학습을 위해 앞선 센서 데이터나 주석 데이터를 효율적으로 준비합니까?신경망을 훈련시키는데 얼마나 힘들지 않고, 많은 스토리지와 컴퓨팅이 필요한가요? 학습 클러스터가 사내 또는 클라우드에 있어야 하는가?스토리지 요구 사항, 네트워크 대역폭, 컴퓨팅 용량을 시작으로 하는 데이터 파이프라인, 학습 클러스터에 맞는 인프라를 어떻게 올바르게 사이즈 설정해 있습니까? 고려해야 할 다른 데이터의 흐름은? 자율주행차의 개발을 위한 데이터 파이프라인 자율주행차의 개발 프로그램은, 각각 고유의 데이터 관리 요건을 가지는 많은 구성 요소를 가지고 있습니다. 데이터의 양과 다양성은 모든 영역에서 고유한 문제를 만듭니다. 이 절에서는 다음과 같은 핵심 영역에서 특정 데이터 및 컴퓨팅 문제를 설명한다.완전 센서 슈트(full sensor suites)가 장착된 테스트 차량의 데이터 수집 테스트 차량에서 파생된 라벨(Label) 데이터를 사용하여 DNN 학습 DNN의 성능을 테스트하고 추가 학습 데이터를 발생하기 위한 시뮬레이션 매핑을 통해 물리적 환경에 대한 상세한 모습이 발생하며 다음 그림은 파이프라인 구성 요소를 상위 수준으로 요약한 것이다.​


    >


    테스트 차량에서의 데이터 수집 데이터 수집 프로세스 동안 데이터는 fleet의 각 테스트 차량으로부터 수집되어야 하는 것이다. 자동차 1대당 실제에 수집하는 데이터의 양은 센서 정장으로 다르다.​ 가이드 라인은 초기 학습 때 때 테러단 하나~5TB의 테테로울 계획하고 실제 결과를 수신할 때 계획을 업데이트하세요.시험 차량의 데이터 수집은 2단계에서 자신이 있습니다.초기 학습(Initial training). 만약 네가 처소음으로부터 DNN을 훈련시키고 있다면, 너는 너의 시험차량에서 모든 운전데이터를 수집해야 할 것이다.• 하달학습(Transfer training), 하나단 여러분의 DNN이 잘 작동하기 시작하면 여러분은 시험차량이 잘 작동하지 않거나 안전운전자가 통제하는 정세에서만 데이터를 수집할 필요가 있으며, 스스로 수집하기 바랍니다.특히 초기 학습 중에는 대역폭 제한과 비용 때문에 각 차량에서 데이터를 휴대 네트워크를 통해 전송할 수 있을 것 같지 않습니다. 각 차량에 데이터를 저장하고 차가 차고 내 창고에 도달할 때 주기적으로 내려받을 가능성이 높습니다.이를 위해서는 각 테스트 차량과 차고 위치 전체에서 데이터멀지 인프라가 필요할 것이다. dest Fleet이 다른 도시로 확장되는 것이고, 그 경우는 각 도시의 데이터를 집계하기 위해서 허브 위치를 추가할 필요도 있습니다.데이터 집계 테스트 차로부터 데이터를 수집할 때 데이터센터 자체 클라우드(또는 양쪽 모두)에서 데이터 레이크(Data Lake)로 집계하는 것이 일반적이다. 데이터 레이크는 일방적으로 HDFS, 객체 저장소 또는 파하나 저장소를 사용하여 Hadoop을 구축하는 형태를 취할 것이다.데이터 레이크가 부적절하게 실장되면 데이터가 축적되어 보틀넥 현상이 발발하는 경우가 있으므로, 이러한 세심한 고려를 하는 것이 중요할 것이다. 수집되는 데이터의 양을 위해 자율주행 개발 프로그램의 현재 모범예는 데이터 레이크와 훈련클러스터를 사내에 두는 것이며 어쩌면 이 프로젝트의 한 부분도 클라우드에 있을 수 있습니다.​ ​ 가이드 라인은 연간 테스토챠랴은당, 적어도 2PB의 데이터에 대한 계획 수립 ​ 다르게 말하면, 테스트, 자율 주행 자동차 하나 0대가 매년 최소 20PB의 데이터 레이크 용량을 계획하는 것이다. 가끔 시간이 지날수록 수집한 데이터의 상당부분이 자주 접속되지 않을 수 있기 때문에 어떤 형태의 콜드(cold)하지 않을 수도 있습니다.데이터 레벨 지정 AV개발에서 가장 큰 병목의 1개는 라벨이 붙은 학습 데이터의 필요성입니다. 특히 초기학습 중에는 알고리즘이 자율주행 중에 자신이 탈 수 있는 다양한 물체(다른 차량, 도로표시, 표지판, 곡선, 보행자, 자전거를 타는 사람 등)를 정확하게 식별할 수 있도록 수백만 개의 라벨화상이 필요할 수 있습니다.​도 하군 이 연간 시험 차당 2PB의 데이터를 예상하는 것이라면 그것은 약 하나 0억개의 이미지와 해석되며, 그 중 300만개 이상의 이미지에 라벨을 붙여야 할 수도 있습니다. 이 분류는 여전히 사람에 의해 거의 이루어지고 있습니다.많은 중견 업체가 인부들을 사용해서 라벨을 표시할 것이다. 이는 세계 다른 지역에서 필요한 데이터에 접근할 수 있도록 하는 것을 의미할 것이다. 라벨이 지정된 이미지에 대한 전송비용에도 불구하고 이를 달성하기 위해 데이터를 클라우드로 이동해야 할 수 있습니다.DNN 학습 자율 주행을 위한 DNN을 설계하는 단일 접근 방식은 없지만 다양한 개별 작업을 수행하는 별도의 DNN이 있는 앙상블 접근 방식을 사용하는 것이 한 가지 반적이다. 예를 들어 경로계획, 객체식별, 판독기호, 정지 등 상태검지 및 기타 기능을 위한 DNN이 있을 수 있습니다.실제로 이것은 여러분이 단순히 자신의 DNN을 훈련시키는 것이 아니라, 여러분은 각 사건의 등급에 대해 다른 접근방식을 포함해 복수의 DNN을 훈련시키고 정기적으로 그럴 가능성이 있다는 것을 의미할 것이다. 이것은 필요한 계산의 규모를 크게 증가시키기 위해 인지하는 것이 중요할 것이다.​ 디플러 닌 학습 클러스터에서 현재 기술의 정 세운 스케 하나의 클러스터에 잠재적으로 소보 댄 수백대와 4~8대의 GPU가 있을 수 있습니다. I/O의 관점에서 그데웅 모든 GPU을 하나 00% 바쁘게 유지해야 할 것. 그 데이터를 기다리는 GPU를 유휴 상태로 방치하는 것을 피해야 할 것이다.NVIDIA DGX-하나 딥러닝 시스템은 8개의 NVIDIA GPU를 지원 CPU와 고성능 인터커넥트를 포함하고 있습니다. AV어린이·케이션의 경우 단 하나 DGX-하나 은 하루에 하 쟈싱의 DNN에 300K상표 이미지를 훈련시킬 수 있습니다. 테스토챠랴은당 300만개의 라벨이 붙은 영상과 다양한 교무욜이 병렬로 실행되어 하나 0개의 DNN이 있다고 가정하면 테스토챠랴은당 최대 하나 00개의 DGX-하나 필요할 수 있습니다.​ 가이드 라인:DNN을 배우기 위한 테스토챠랴은당 하나 00대의 DGX·하나 시스템(또는 그에 상응하는 시스템)에 대한 계획을 수립하세요.시뮬레이션 재시뮬레이션의 대부분의 AV개발 프로그램에서 시뮬레이션은 프로세스의 중요한 구성요소이다. 시뮬레이션을 통해 DNN은 다양한 주행환경을 시뮬레이션하고 테스트 차량에서 수집된 실제 시자리오를 재생하여 신속하게 테스트할 수 있습니다(그런 시자리오의 변형뿐만 아니라).시뮬레이션은 그 자체에 상당한 연구와 혁신의 영역이다.많은 중견기업이 특히 자율주행과 로봇을 위한 현실적인 시뮬레이션에 초점을 맞추고 있습니다. 시뮬레이션의 성공에는 다양한 측면이 있습니다.필요한 해상도의 달성 및 모든 차량 센서에 대한 실제 입력의 제공·연구 중인 DNN의 앙상블에 필요한 추론 성능의 제공, 각종 시뮬레이션 스트림이 병렬로 실행될 가능성·차량, 자전거, 보행자 및 기타 모든 비 정차 요소의 정확한 모델링. ​ 3D, 매핑, 많은 AV프로그램, 더 중요한 요소는 고화질 3D매핑임. 많은 에이브이 접근 경로에서 고화질 지도를 이용할 것이다. 차량 센서어레이에서 기존 지도까지의 출력을 비교하는 것은 경로계획 프로세스를 단순화하는 방법으로 많은 사람에 의해 고려됩니다.만약 이것이 당신이 사용하려는 접근방식이라면, 당신이 먼저 당신만의 매핑을 할지, 다른 사람의 데이터에 의존할지 결정해야 할 것이다. 많은 신생 중견기업과 다른 중견기업들이 데이터 세트 매핑 작업을 하고 있습니다.자신만의 매핑을 하는 것은 경쟁적인 이점을 제공할 수 있고, 그것은 당신이 계획한 센서 어레이와 보다 밀접하게 하나이지만, 상당한 추가 투자를 자신 있게 하는 HD지도를 만들 수 있게 해줍니다. 대상 지역에 맞는 고해상도 3D지도를 직접 만들 계획이라면 필요한 모든 곳에 매핑 데이터를 수집, 처리 및 제공하기 위해서 필요한 데이터나 파이프 라인을 수집하기 위해서 적절한 센서를 갖춘 연구가 필요할 것. 매핑 프로세스는 프로그램이 확장될 때 새로운 영역으로 확장되어야 하며 지도는 정기적으로 고쳐 써야 합니다.끼어드는 자율주행차를 개발하는 입장에서 보면 가장 중요한 소견은 아마도 금지됐지만 말한 Data를 어떻게 잘 관리할 것인가 하는 점일 것이다. 자율주행차량에 관한 뉴스를 접하면 자율주행에서 주행거리, 주행에서 얻을 수 있는 정보의 라벨 정의, AI를 위한 학습 등을 말합니다. 그런 정보를 단발적으로 접하게 되면 어떤 소음인지 이해하지 못하는 분들도 있을 수 있습니다. 이번 뉴스는 그런 정보를 간략하게 연결시키는 것이 아닌가 싶다.결말 자율주행차는 기술적인 이 말에서의 최종 목적은 사람을 대신하는 인공지능을 가진 로봇을 구현하는 것이다. 이런 AI를 위해서는 사람이 성장하면서 학습하는 것처럼 AI에게도 학습 과정을 거쳐 인간 수준이 될 수 있을 것이다. 사람도 많은 경험을 하며 그러한 경험의 적절한 조합으로 새로운 정세에 합리적인 판단을 할 수 있습니다. 자율주행차의 AI 또는 합리적인 운전을 하려면 남들이 하는 것과 똑같은 경험을 하고 그런 경험을 바탕으로 앞으로 운전을 할 때 더 자신감은 반응을 보여야 할 것이다. 사람은 스스로 경험하고 판단하는 단 하나의 존재로 모든 것을 해결할 수 있지만, AI의 경우는 그러한 경험을 학습하기 위한 별도의 입력 장치의 Data가 필요할 것이다. 그래서 자율주행차를 개발하는 중견기업이 테스트 차량을 통해 많은 데이터 수집에 집중하고 있습니다.그러나 그렇게 수집된 데이터는 어떻게 활용하느냐는 자율주행차를 개발하는 중견기업에 의해서겠지만, 개별적으로 발생하는 테스트 차량의 데이터를 수집하고 정리하고 필요한 작업을 하려면 자율주행차를 개발하는 모든 사람이 같은 정보를 공유해야 한다. 이를 위해서는 데이터를 다운로드할 수 있는 저장소가 필요하며 어디서든 접근할 수 있는 클라우드가 제공되어야 한다. 본문을 작성한 중견기업이 그러한 제품을 제공하는 중견기업이다.저도 가끔 자율주행차를 개발하는 중견기업이 AWS, Microsoft 같은 클라우드 서비스를 제공하는 중견기업과 협력한다는 소식을 전해드렸습니다. Microsoft의 경우 신생 스타트업을 위해 무상으로 지원하는 프로그램도 진행되었습니다. 즉, 이러한 자율주행차의 데이터를 관리하는 것은 많은 비용이 필요한 작업이다. 작은 중견기업에서는 쉽게 접근할 수 없음을 단적으로 보여줄 수도 있을 것이다. 이러한 이유, 최근 들어 많은 중견기업들은 자신들이 데이터를 연구 목적의 기관에 dataset을 제공하고 있습니다. 그래서 WEF의 경우에는 dataset 공유를 위한 프로젝트를 시작했습니다.자율주행차의 발전 방향이 어떻게 진행될지는 정확하게는 예상할 수 없습니다. 현재는 기술적 발전보다는 사회적 수용에 대해 더 많은 말을 하고 있으니까요. 이러한 사회적 수용에 대한 말을 보다 진전시킴에 따라 이러한 데이터 공유에 관한 말도 진전되지 않을까 생각된다. 수많은 자율주행차들의 '욕심'을 다양한 단체에서 진행 중입니다. 이런 움직임으로 보다 안전한 자율주행차 개발을 위한 데이터 공유를 하자는 생각이 모아지면서 최근 보다 활발한 공유의 길이 열리지 않을까 한 번 소견합니다.이 공지는 Net App이라는 중견 기업에서 자율주행차의 Data 관리와 자신들의 제품을 소개하는 것이었습니다. 글 쓰는 중간중간 포함된 Net App제품에 대한 소개 이 말은 제외하고 자율주행차의 Data관리 프로세스를 간단하게 소개했습니다. 만약 Net App관련 제품 정보가 필요하신 분 계시면 아래 참고자료의 원문 사이트를 참조하시기 바랍니다.p.s 검색에서 보시고, 만약 원하시는 이 단어를 찾지 못하셨을 경우, '태그' 또는 '검색'을 해보시면 더 많은 자료를 찾을 수 있습니다. 그래도 뭐 찾으실 말씀 없으시면 저한테 연락 주시면 (이미하나,메시지) 제가 아는 범위 내에서 도와드리고 싶습니다. 부다 소음을 가지지 않아도 됩니다.Over the Vehicle!!!참고 자료



    댓글

Designed by Tistory.