LiDAR

Deep Learning : เหตุผลหลักที่ Tesla ไม่ใช้ LiDAR

เป็นเรื่องที่เถียงกันมาตลอด ว่าเทคโนโลยีไหนที่เหมาะที่สุดสำหรับยานยนต์อัตโนมัติ

ระหว่าง LiDAR ที่นำโดย Waymo บริษัทลูกของ Google กับ camera-based (หรือ vision-based) ที่มี Tesla เป็นตัวชูโรง

ที่ผ่านมา สื่อมักตัดตอนบทสัมภาษณ์ อีลอน มัสก์ ที่พูดถึง LiDAR มา เฉพาะคำพูดสั้น ๆ ว่า “แพงไป” “ไม่จำเป็น” ฯลฯ

แต่ไม่ได้ระบุให้ชัดว่าเพราะอะไรกันแน่ ถึงไม่ใช้

จนเมื่อเร็ว ๆ นี้ อันเดรช คาร์พาที (Andrej Karpathy) หัวหน้าทีมวิจัย AI ของ Teslaได้เฉลยเรื่องนี้ ในงาน Conference on Computer Vision and Pattern Recognition (CVPR) ปีล่าสุด

ว่า การให้ AI เรียนรู้ผ่านวิธี Deep Learning เพื่อให้ขับรถได้เหมือนกับมนุษย์

คือเหตุผลหลักว่าทำไมบริษัทฯ ถึงมั่นใจกับการใช้ camera-based ขนาดนั้น

 

#Deep Learning คืออะไร?

เจฟฟ์ เบโซส ผู้ก่อตั้ง Amazon เคยกล่าวว่านี่คือยุคทองของ AI

เพราะเทคโนโลยีในการผลิตหน่วยประมวลผล GPU ที่ทำงานได้เร็วขึ้นและแรงขึ้น ในราคาที่ถูกลง

ทำให้แนวคิดเรื่อง Artificial Neural Networks หรือ ANN หรือการสอน AI ให้ทำงานแบบระบบเซลล์ประสาทในสมองของมนุษย์ กลายเป็นจริงได้

และ Deep Learning ก็คือการนำแนวคิด ANN ในระดับที่ลึกและซับซ้อนขึ้น

ปัญญาประดิษฐ์ที่ถูกเทรนด้วยแนวทางนี้ จึงมีความแม่นยำในการแยกแยะสิ่งต่าง ๆ วินิจฉัยโรคได้ คิดค้นกลยุทธ์ในเกมกระดาษได้แบบ AlphaGo

ซึ่งก็รวมถึงควบคุมยานยนต์อัตโนมัติ ที่ Tesla กำลังพยายามทำอยู่

ด้วยการสอนให้ AI อาศัยแค่ข้อมูลภาพจากกล้องรอบตัวรถ ก็สามารถควบคุมรถให้ขับอย่างปลอดภัยได้

(อ่านเพิ่มเติม AI / Machine Learning / Deepl Learning เหมือนหรือต่างกันอย่างไร?)

 

#เหตุผลที่ Waymo ใช้ LiDAR

จริง ๆ แล้ว Waymo และผู้พัฒนา AV รายอื่น ๆ ก็ใช้แนวคิด Deep Learning ในการสอน AI ควบคุมรถเหมือนกัน

แต่เหตุผลที่บริษัทเหล่านี้ เลือกใช้ LiDAR ช่วยสนับสนุนการทำงาน เพราะเชื่อว่า AI ยังมีข้อจำกัดอยู่

ทั้งในเรื่องการกะระยะ (range-finding) และประเมินความลึก (depth estimation)

การมี LiDAR ที่ช่วยสร้างภาพแผนที่ 3 มิติรอบตัวรถระหว่างเดินทาง จะช่วยอุดช่องว่างตรงนี้ได้

 

อ่านเพิ่มเติมเกี่ยวกับ LiDAR ได้ใน Waymo รถไร้คนขับ บนหนทางสู่อนาคต

 

เหตุผลที่ Tesla ไม่ใช้ LiDAR

คาร์พาที อธิบายว่า ปัญหาของ LiDAR คือกระบวนการทำงานที่ซับซ้อน จนทำให้ไม่สามารถสเกลอัพได้ ในภาคการผลิตและการใช้งาน

เพราะการใช้งาน LiDAR จะสมบูรณ์ได้ ต้องใช้ข้อมูลแผนที่ซึ่งแม่นยำมาก ๆ ต้องมีการเชื่อมต่อสัญญาณไฟจราจร ในทุกเส้นทางที่รถจะเดินทางไป

ซึ่ง ณ ปัจจุบัน เป็นไปได้ยาก หรือเป็นไปได้ ก็คือการใช้งานในพื้นที่จำกัดที่มีการควบคุมเท่านั้น

 

#ทางที่ Tesla เลือก

ขณะที่ Tesla เลือกใช้ข้อมูลจากกล้องแปดตัวรอบตัวรถ ป้อนให้ AI ตัดสินใจในสถานการณ์เฉพาะหน้า โดยไม่ต้องอ้างอิงข้อมูลที่ถูกรวบรวมมา

ซึ่งในแง่การพัฒนาถือว่ายากกว่า

แต่ คาร์พาที เชื่อว่าถ้าทำสำเร็จ รถของ Tesla จะเป็นยานยนต์อัตโนมัติที่เดินทางไปที่ไหนก็ได้ เหมือนการให้คนขับจริง ๆ

พร้อมย้ำว่า ณ ปัจจุบันการสอน AI ด้วยวิธี Deep Learning ของ Tesla พัฒนาไปไกลแล้ว

คาร์พาที อธิบายถึงเรื่องนี้ว่าเหตุผลที่ เรดาร์ (Radar) ถูกถอดออกจากสายการผลิตรถรุ่นใหม่ ๆ ของบริษัท

เพราะ AI ของรถ ทำงานได้แม่นยำ จนข้อมูลจากเรดาร์กลายเป็น “ตัวถ่วง” ไปแทน

 

#ทำไม Deep Learning ของ Tesla ถึงก้าวหน้ากว่าคู่แข่ง?

คาร์พาที อธิบายว่า ปกติคนเราก็ขับรถโดยกะระยะด้วยสายตาอยู่แล้ว

สิ่งที่ Tesla ทำ ก็คือป้อนข้อมูลผ่าน Deep Learning เข้าใจและทำแบบเดียวกัน

ซึ่งการจะทำแบบนั้นได้ ก็ต้องใช้ข้อมูลมหาศาลจากวิดีโอที่รวบรวมจากกล้องวิดีโอในรถ Tesla หลายล้านคันทั่วโลก เพื่อนำมาให้ AI เรียนรู้

และตรงนี้เองเป็นแต้มต่อที่ Tesla เหนือกว่าบริษัทอื่น ๆ

 

ปัจจุบัน ทีมพัฒนาของ Tesla มีข้อมูลด้านนี้ ถึง 1.5 เพตะไบต์ (1 PB เท่ากับ 1024 เทระไบต์)

แบ่งเป็นวิดีโอความยาว 10 วินาที บันทึกที่ 36 เฟรมต่อวินาที จำนวน 1 ล้านคลิป กับตัวอย่างวัตถุ 6,000 ล้านแบบ ที่แสดงขอบเขต ความลึก และอัตราเร่ง

แต่การมีข้อมูลมหาศาลในมืออย่างเดียว ก็จำเป็นต้องมีการระบุประเภทข้อมูล (labeling) ที่ดีด้วย

(ทำความรู้จักกับการ labeling ข้อมูลเพิ่มเติม ได้ใน Vulcan Coalition : ปั้นคนพิการสู่ AI Trainer อัจฉริยะ)

 

ทีมงาน Tesla ใช้หลาย ๆ แนวทางผสมกัน

คือระหว่างที่ชุดข้อมูลกำลังถูก label แบบออฟไลน์โดยทีมวิศวกร ซึ่งใช้เครื่องมือที่มีพลังในการประมวลผลสูงกว่า และมีความหน่วงต่ำกว่าที่ใช้ในรถ

ตัวโครงข่ายประสาทของ AI ก็จะเรียนรู้ข้อมูลจากวิดีโอ เพื่อนำเปรียบเทียบการคาดการณ์กับความจริงพื้นฐาน และนำมาปรับพารามิเตอร์ของตัวเอง

ในรถที่ใช้ทำการทดสอบ จะยังมีเรดาร์อยู่ (และเมื่อเร็ว ๆ นี้ ก็มีข่าวว่ามีการนำ LiDAR มาช่วยเก็บข้อมูลด้วย) และข้อมูลจากส่วนนี้จะถูกนำมาใช้เพื่อตรวจสอบการอนุมานของ AI ควบคู่กันไป

 

หลังการพัฒนาและปรับแต่งข้อมูล โครงข่ายประสาทเหล่านี้ก็จะถูกนำไปติดตั้งในรถที่ใช้งานจริง แต่เปิดเป็น shadow mode คือปล่อยให้มันเรียนรู้จากสถานการณ์จริง “แต่ไม่สามารถออกคำสั่งในการควบคุมรถได้”

จากนั้น ทีมงานจะนำข้อมูลใหม่ ๆ ที่ได้ มาทบทวน แก้ไข รวมถึงเพิ่มเติมลงไปในการเรียนรู้

 

#เทรน AI ด้วยซูเปอร์คอมพิวเตอร์

ในการเทรน AI แบบ deep learning คาร์พาที เล่าว่า Tesla ใช้ซูเปอร์คอมพิวเตอร์ Dojo ที่มีสมรรถนะระดับเดียวกับซูเปอร์คอมพิวเตอร์อันดับ 5 ของโลก

และมีทีมงานเฉพาะทางที่ดูแลด้านนี้ถึง 20 คน

เสริมด้วยจุดแข็งของบริษัทคือการพัฒนา สร้าง และปรับแต่ง ทั้งฮาร์ดแวร์และซอฟต์แวร์สำหรับ AV ไปพร้อม ๆกัน

ทำให้ไม่จำเป็นต้องพึ่งพาบุคคลที่สามซึ่ง คาร์พาที มองว่าเป็นอุปสรรคในการพัฒนา

พร้อมย้ำว่าเมื่อไหร่ที่ AI ที่ถูกเทรนจนทำงานได้ใกล้เคียงมนุษย์

LiDAR ที่ Waymo และอีกหลายบริษัทพยายามพัฒนาอยู่นั้น จะกลายเป็นเทคโนโลยีที่ “ตกยุค” (obsolete) ไปในที่สุด

#TAKEAWAY

ประเด็นคือ ณ ปัจจุบัน ความสามารถของ AI ที่ผ่านการ deep learning ของ Tesla อยู่ในระดับไหนแล้ว?

เพราะการขับรถของมนุษย์ นอกจากสายตา ยังมีความเชื่อมโยงกับปฏิกิริยาตอบสนองที่ซับซ้อนอีกหลายอย่าง

นอกจากนี้ AI ที่เรียนรู้จาก deep learning ก็ยังมีจุดอ่อน เรื่องการไม่สามารถรับมือกับสถานการณ์ใหม่ ๆ ที่ไม่เคยเจอมาก่อนอยู่

เพราะถึง Tesla จะมีคลังข้อมูลมหาศาล แต่การขับรถบนถนนจริง ก็ยังมีตัวแปรที่ทำให้เกิดเรื่องเหนือความคาดหมายได้ตลอดเวลา

แล้วคุณล่ะ? คิดว่าสุดท้ายแล้วใครจะเป็นฝ่ายที่คิดถูกกันแน่ ระหว่าง Waymo กับ Tesla

เรียบเรียงจาก
Tesla AI chief explains why self-driving cars don’t need lidar

Elon Musk called lidar a ‘crutch,’ but now Tesla is reportedly testing Luminar’s laser sensors

AHEAD ASIA นวัตกรรม ล้ำหน้า

Subscribe to Our Newsletter

Total
0
Shares
Previous Article
Bitkub

คุยเรื่องอนาคตคริปโต กับ จิรายุส ทรัพย์ศรีโสภา ซีอีโอและผู้ก่อตั้ง Bitkub

Next Article

Cocuus : สเต็กเนื้อจากเครื่องพิมพ์ 3 มิติ

Related Posts