Trong những năm gần đây, công nghệ LiDAR đã và đang cho thấy được tầm quan trọng của mình đối với sự tăng trưởng nhanh chóng trong lĩnh vực công nghệ và đời sống của con người. Theo số liệu thống kê từ Mordor Intelligence, thị trường LiDAR toàn cầu ước tính đạt $2.57 nghìn tỷ trong năm 2024 và dự tính đạt khoảng $6.3 nghìn tỷ vào năm 2029 với tốc độ tăng trưởng hàng năm (CAGR) là 19.93% trong khoảng thời gian 2024 – 2029. Một trong những lý do khiến công nghệ LiDAR trở thành xu hướng là khi nhu cầu xe tự lái ngày càng tăng cùng tính ứng dụng cao của công nghệ này ở nhiều lĩnh vực khác nhau.
Vậy, chính xác thì công nghệ LiDAR là gì? Làm thế nào để chú thích những dữ liệu từ máy cảm biến LiDAR? Những ứng dụng thực tế của việc chú thích LiDAR trong nhiều lĩnh vực khác nhau sẽ như thế nào? Và các xu hướng cũng như thách thức của quá trình chú thích LiDAR sẽ là gì? Trong bài viết dưới đây, hãy cùng hệ thống hoá những thông tin và kiến thức về chú thích LiDAR để có một cái nhìn tổng quan nhất về kĩ thuật chú thích dữ liệu này.
Công nghệ LiDAR là gì?
LiDAR, viết tắt của Light Detection and Ranging, là một công nghệ cảm biến từ xa sử dụng ánh sáng dưới dạng tia laser để đo khoảng cách tới một vật thể hoặc bề mặt. Công nghệ này hoạt động bằng cách phát ra tia laser từ một nguồn, sau đó thu nhận ánh sáng phản xạ lại từ bề mặt đối tượng. Thời gian mà ánh sáng laser di chuyển từ nguồn đến đối tượng và trở lại được sử dụng để tính toán khoảng cách, tạo ra một bản đồ 3D chi tiết của khu vực được quét.
Chú thích LiDAR là gì?
Chú thích LiDAR là quá trình phân loại và gán nhãn các đối tượng trong các điểm dữ liệu 3D được thu thập từ cảm biến LiDAR. Có thể nói rằng quá trình chú thích LiDAR rất quan trọng trong việc đào tạo các mô hình máy học (Machine Learning model) bởi chất lượng từ những hình ảnh được chú thích sẽ ảnh hưởng trực tiếp đến hiệu suất của thuật toán và là bước quan trọng để có được khả năng nhận dạng đối tượng và hiểu môi trường xung quanh một cách chính xác.
Các Phương Pháp Chú Thích LiDAR Phổ Biến
Thông qua định nghĩa phía trên, có thể thấy rằng LiDAR là một công nghệ phức tạp và để chú thích được những dữ liệu thu thập được từ LiDAR sẽ cần một số phương pháp chú thích chính xác. Hãy cùng khám phá những loại chú thích LiDAR phổ biến dưới đây và vai trò của chúng trong các dự án.
3D Cuboid
3D Cuboid là một khối lập phương được sử dụng để bao quanh một đối tượng hoặc vật thể trong không gian 3 chiều. Việc sử dụng phương pháp chú thích này sẽ giúp phân loại, xác định vị trí, kích thước và hướng của đối tượng. Đây có thể được xem là phương pháp chú thích dễ và nhanh nhất đối với các hình ảnh dữ liệu thu thập được từ LiDAR. Tuy nhiên, 3D Cuboid sẽ không thể đáp ứng được nhu cầu sử dụng đối với những đối tượng hoặc vật thể cần chú thích chi tiết và phức tạp như cây cối, đường dây điện, mạng lưới đường ống, etc.
Phân đoạn ngữ nghĩa (Semantic Segmentation)
Phân đoạn ngữ nghĩa là phương pháp gán nhãn cho từng đối tượng hoặc nhóm đối tượng trong một hình ảnh thành các lớp tương ứng với nội dung ngữ nghĩa riêng biệt chẳng hạn như đường, vỉa hè hoặc toà nhà. Bên cạnh việc giúp xác định và phân loại đối tượng, phương pháp phân đoạn ngữ nghĩa còn cung cấp thông tin về bối cảnh xung quanh các đối tượng trong môi trường 3 chiều và cải thiện độ chính xác khi chú thích.
Dẫu vậy, việc sử dụng phương pháp phân đoạn ngữ nghĩa trong quá trình chú thích LiDAR có thể phức tạp và đòi hỏi chuyên môn cao. Trong trường hợp dữ liệu hình ảnh thu thập được từ LiDAR bị nhiễu hoặc không đầy đủ thì kết quả chú thích bằng phương pháp semantic segmentation cũng có thể bị ảnh hưởng.
Phân đoạn đối tượng (Instance Segmentation)
Phương pháp phân đoạn đối tượng không chỉ phân biệt từng lớp như phân đoạn ngữ nghĩa mà còn phân biệt từng đối tượng riêng biệt trong cùng một lớp. Trong quá trình chú thích LiDAR, phân đoạn đối tượng sẽ có vai trò theo dõi từng đối tượng riêng lẻ, đếm số lượng đối tượng khác nhau và phân tích hành vi của các đối tượng. Tương tự như phân đoạn ngữ nghĩa, phương pháp phân đoạn đối tượng có độ phức tạp và đòi hỏi người thực hiện phải có chuyên môn kỹ thuật cao. Hơn thế nữa, phương pháp này sẽ khó xác định chính xác các đối tượng bị che khuất hoặc chồng chéo.
Chú thích điểm (Point-level annotation)
Phương pháp này dùng để gán nhãn các đặc điểm hoặc cấu trúc của đối tượng, thường được sử dụng với các mục đích nhận dạng khuôn mặt, cảm xúc cũng như hành vi của đối tượng. Trong trường hợp các dữ liệu hình ảnh LiDAR được thu thập từ nhiều nguồn khác nhau, phương pháp point-level sẽ giúp đồng bộ hoá thời gian, chuyển đổi hệ toạ độ, định vị, định hướng và đối chiếu dữ liệu, khiến việc phân tích và ứng dụng dữ liệu trở nên đáng tin cậy.
Mặt khác, phương pháp point-level sẽ khó sử dụng được đối với những địa hình hoặc đối tượng phức tạp. Hơn thế nữa, dữ liệu hình ảnh LiDAR về môi trường xung quanh sẽ thường xuyên được cập nhật khiến việc chú thích bằng phương pháp point-level có thể phức tạp, tốn kém và khó duy trì.
Chú thích quỹ đạo (Trajectory annotation)
Trajectory bao gồm một chuỗi các đoạn thẳng được nối với nhau bằng các nút, là phương pháp chú thích sử dụng các đường gấp khúc để chú thích các đặc điểm trong dữ liệu hình ảnh hoặc dữ liệu không gian 3 chiều. Trong chú thích LiDAR, phương pháp trajectory được sử dụng để vẽ ranh giới của các đối tượng tuyến tính trong cảnh quan chẳng hạn như đường sá, đường ray, làn đường, đường dây diện, sông ngòi, etc. Đối với những dữ liệu hình ảnh có tính cập nhật thường xuyên như LiDAR, trajectory có thể dễ dàng được chỉnh sửa để phản ảnh các thay đổi trong môi trường thực tế, thể hiện tầm quan trọng trong việc duy trì độ chính xác của các bản đồ và không gian. Dù vậy, đây không phải là phương pháp chú thích tốt nhất cho các đối tượng không tuyến tính, có hình dạng phức tạp hoặc các cấu trúc có chi tiết nhỏ.
Ứng Dụng Thực Tiễn của Chú Thích LiDAR
Xe tự lái
Trong ứng dụng thực tế, các xe tự lái dựa vào LiDAR, một công nghệ hoạt động bằng cách sử dụng ánh sáng laser để quét môi trường xung quanh và tạo ra bản đồ 3D có độ phân giải cao. Sau khi trải qua quá trình chú thích, những bản đồ này đóng một vai trò quan trọng cho phép các phương tiện phát hiện và phân loại chính xác các vật thể như người đi bộ, biển báo giao thông hoặc các chướng ngại vật khác trên đường. Từ những nhận biết chính xác này, các phương tiện tự lái có thể điều hướng, đưa ra quyết định và phản ứng với môi trường xung quanh một cách hiệu quả, cải thiện đáng kể khả năng va chạm. Có thể nói rằng chú thích LiDAR là chìa khoá thiết yếu để khai thác toàn bộ tiềm năng của xe tự lái, góp phần hiện thực hoá cho một tương lai giao thông thông minh.
Khảo sát và nghiên cứu môi trường
Để dễ hình dung hơn về vai trò của chú thích LiDAR trong lĩnh vực này, hãy lấy quá trình phân tích rừng làm ví dụ. Công nghệ LiDAR sử dụng tia laser quét từ phía trên của ngọn cây để có thể thu thập dữ liệu cảnh quan chi tiết. Và việc chú thích những lần quét này cung cấp cho các nhà nghiên cứu những thông tin thiết yếu để có thể đánh giá sự đa dạng sinh học của các khu rừng chẳng hạn như chiều cao của cây, bản đồ phân bố loài và các mô hình tăng trưởng khác nhau. Các chú thích LiDAR còn hỗ trợ các nhà nghiên cứu xa hơn trong việc dự đoán thiên tai bằng cách xác định chính xác các khu vực có rủi ro cao, từ đó phát triển các phương án dự án dự phòng. Cuối cùng, việc ứng dụng LiDAR trong nghiên cứu môi trường giúp các nhà hoạch định sử dụng tài nguyên một cách hiệu quả và đưa ra những quyết định sáng suốt nhằm thúc đẩy sự cân bằng lành mạnh trong môi trường sống tự nhiên.
Quản lý hạ tầng
Một trong những ứng dụng phổ biến khác của chú thích LiDAR là giúp quản lý cơ sở hạ tầng và phát triển đô thị. Như chúng tôi đã phân tích ở trên, công nghệ LiDAR cho phép tạo ra những bản đồ 3D chính xác về khu vực xung quanh và điều này cũng tương tự với việc có thể tạo ra bản đồ 3D về cơ sở hạ tầng như đường xá, cầu, toà nhà cũng như các hệ thống tiện ích khác. Việc chú thích những dữ liệu hình ảnh này sẽ giúp các chuyên gia quy hoạch đô thị dễ dàng quản lý tài sản, hỗ trợ thiết kế và xây dựng các công trình mới, đảm bảo tất cả các yếu tố cơ sở hạ tầng đều được duy trì đúng cách và các dự án phát triển được thực hiện hiệu quả.
An ninh quốc phòng
Trong lĩnh vực an ninh quốc phòng, việc sử dụng công nghệ LiDAR sẽ giúp các cơ quan an ninh có các thông tin về mặt địa hình, các tuyến đường đi, hoặc các cơ sở hạ tầng quân sự. Và bằng việc chú thích những hình ảnh này sẽ hỗ trợ các cơ quan an ninh trong quá trình giám sát biên giới, phân tích các vị trí chiến lược, ngăn chặn các hoạt động bất thường cũng như phản ứng nhanh với các tình huống khẩn cấp. Thêm vào đó, chú thích LiDAR sẽ nâng cao mức độ chuẩn bị của lực lượng quân sự thông qua các kịch bản tác chiến được tái hiện dựa trên dữ liệu địa hình thực tế.
Khảo cổ học
Chú thích LiDAR đang dần cách mạng hoá ngành khảo cổ học bằng khả năng phát hiện, nghiên cứu và bảo tồn các di tích cổ. Để cụ thể hơn, công nghệ LiDAR có thể quét các khu vực rộng lớn ở độ phân giải cao, giúp phát hiện các cấu trúc bị chôn vùi dưới lòng đất, bị địa hình che khuất hoặc ẩn dưới thảm thực vật. Và việc chú thích dữ liệu LiDAR cho phép các nhà khảo cổ xác định vị trí và lập mô hình chính xác các di tích này, tạo điều kiện thuận lợi cho việc phân tích chi tiết về các cấu trúc cũng như môi trường xung quanh chúng. Không chỉ dừng lại ở khả năng khám phá, chú thích LiDAR còn khẳng định giá trị thiết yếu khi giúp các nhà khảo cổ học dự đoán tình trạng xuống cấp của di tích bằng cách theo dõi những thay đổi trong chú thích theo thời gian, từ đó đưa ra các biện pháp bảo tồn kịp thời để bảo vệ các di sản quý giá.
Xu Hướng Phát Triển Chú Thích LiDAR Trong Những Năm Tới
Chú thích LiDAR yêu cầu chất lượng cao
Khi ứng dụng của chú thích LiDAR trong các lĩnh vực thực tiễn ngày càng mở rộng đồng nghĩa với nhu cầu chú thích dữ liệu LiDAR chất lượng cao sẽ ngày càng tăng, đặc biệt là trong lĩnh vực xe tự động lái. Nguyên do là vì việc chú thích chính xác và toàn diện những dữ liệu hình ảnh LiDAR sẽ giúp các xe tự động lái vận hành an toàn, hiệu quả cũng như đem lại lợi thế cạnh tranh cho các công ty trong cùng ngành. Chính vì vậy, bằng cách tập trung công sức vào các kỹ thuật tiên tiến kết hợp với làm việc cùng đội ngũ kỹ sư chuyên môn cao, các công ty sẽ đảm bảo được chất lượng dữ liệu hình ảnh được chú thích ở mức cao nhất, góp phần tạo nên sự thành công trong lĩnh vực hoạt động của họ.
Đọc thêm: Cần làm gì để có nguồn chú thích dữ liệu chất lượng cho Máy học?
Chú thích tự động hoá và được hỗ trợ bởi AI
Một xu hướng của chú thích LiDAR trong những năm tới là sử dụng các kỹ thuật tự động hóa và được hỗ trợ bởi AI để đẩy nhanh quá trình, giảm thiểu sự can thiệp của con người và tăng tỷ lệ chính xác của dữ liệu được chú thích. Bên cạnh đó, các mô hình học sâu (Deep Learning model) như Convolutional Neural Networks (CNN) và Recurrent Neural Networks (RNN) cũng sẽ được tận dụng để tự động thực hiện các tác vụ như phát hiện đối tượng hoặc phân đoạn ngữ nghĩa. Dẫu vậy, việc chú thích tự động sẽ luôn có xác xuất lỗi xảy ra, và điều này yêu cầu người giám sát dự án phải chủ động trong quy trình quản lý chất lượng, đảm bảo được các kết quả đầu ra độ chính xác cũng như độ chi tiết cao.
Học bán giám sát và không giám sát
Những kỹ thuật này sẽ tận dụng một lượng nhỏ dữ liệu đã được gán nhãn kết hợp với dữ liệu không gán nhãn hoặc gán nhãn một phần để đào tạo các mô hình máy học (Machine Learning model) hiệu quả hơn. Trong chú thích LiDAR, việc áp dụng những kỹ thuật này sẽ giúp phát hiện những đối tượng ẩn, giảm công sức và tiết kiệm chi phí chú thích thủ công. Tuy nhiên, cũng như những kỹ thuật chú thích tự động khác, việc áp dụng học bán giám sát và không giám sát đòi hỏi phải có quá trình giám sát từ con người để kết quả đầu ra được nhất quán, tránh được những sai sót không đáng có.
Chú thích 4D
Đây được coi là một xu hướng mới nổi trong lĩnh vực máy học (Machine Learning) và trí tuệ nhân tạo (AI). Trong quá trình chú thích LiDAR, chú thích 4D cho phép gán nhãn các đối tượng trong không gian 3 chiều cộng thêm chiều thời gian để theo dõi quỹ đạo cũng như chuyển động của các đối tượng. Trong lĩnh vực thực tế như xe tự động lái, việc ứng dụng phương pháp chú thích này sẽ cải thiện khả năng nhận diện và dự đoán hành vi của các đối tượng chuyển động như người đi đường hoặc xe cộ, từ đó đưa ra quyết định lái xe an toàn hơn.
Sử dụng dữ liệu tổng hợp
Dữ liệu tổng hợp là những thông tin được tạo nên từ thuật toán, được thiết kế để mô phỏng các đặc điểm và cấu trúc của dữ liệu gốc. Trong bối cảnh dữ liệu thực tế có thể bị hạn chế hoặc khó thu thập, đây sẽ là xu hướng tương lai giúp đảm bảo nguồn dữ liệu LiDAR đầu vào được phong phú, tiết kiệm được thời gian cũng như chi phí khi thu thập dữ liệu. Có thể thấy rằng việc sử dụng dữ liệu tổng hợp cũng sẽ giúp đào tạo toàn diện cho các mô hình, giúp cải thiện sự hiểu biết và phân tích môi trường xung quanh. Dù vậy, người dùng dữ liệu tổng hợp cần phải kiểm tra kỹ thông tin để đảm bảo tính đúng đắn, độ tin cậy và sự phù hợp với mục đích sử dụng.
Khó Khăn và Thách Thức Khi Chú Thích LiDAR
Khối lượng dữ liệu
Các tệp dữ liệu LiDAR thường chứa hàng triệu đến hàng tỷ điểm dữ liệu khác nhau. Đối với các công ty chú thích LiDAR bằng cách thủ công, việc xử lý một khối lượng dữ liệu khổng lồ như vậy đòi hỏi thời gian, nguồn nhân lực lớn và quy trình quản lý chặt chẽ để có thể đảm bảo chất lượng cũng như độ chính xác cao.
Độ phức tạp của đối tượng 3D
Trong môi trường không gian 3 chiều, các đối tượng sẽ có nhiều hình dạng khác nhau, từ đơn giản như hình cầu, hình hộp đến phức tạp như cây cối, toà nhà hoặc xe cộ. Ngoài những đối trượng trên, trong một vài tệp dữ liệu LiDAR sẽ bao gồm những đối tượng bị chồng chéo hoặc bị che khuất, và việc chú thích cho những đối tượng 3D phức tạp này yêu cầu thời gian, công sức lớn từ người chú thích, thậm chí là phần mềm và thuật toán để xử lý hiệu quả.
Chi phí
Chi phí ảnh hưởng đến quá trình chú thích LiDAR theo nhiều cách khác nhau. Ngoài những chi phí về phần cứng và thiết bị ban đầu, đối với các công ty sử dụng phần mềm để xử lý phần lớn các tệp dữ liệu LiDAR, họ sẽ cần chú ý đến chi phí bản quyền, chi phí cho việc cập nhật và duy trì phần mềm. Đối với những công ty chú thích LiDAR bằng cách thủ công, họ sẽ cần để ý đến chi phí nhân sự bởi quá trình này đòi hỏi người chú thích phải có kỹ thuật chuyên môn cao đồng thời để giải quyết những tệp dữ liệu lớn sẽ cần nguồn nhân sự lớn.
Chú Thích LiDAR và Hành Trình dẫn đến Tương Lai
Chú thích LiDAR là một quy trình đầy thách thức, đòi hỏi sự tỉ mỉ và chính xác cao để có thể xử lý khối lượng dữ liệu hình ảnh lớn cũng như tính phức tạp của các đối tượng 3D. Dẫu vậy, sự phức tạp này cũng phản ánh tiềm năng to lớn của LiDAR trong các ứng dụng thực tiễn. Đặc biệt, trong hệ thống hỗ trợ lái xe nâng cao (ADAS), quá trình chú thích LiDAR không chỉ nâng cao khả năng phân tích và xử lý hệ thống tự động mà còn mở ra những triển vọng mới cho công nghệ xe tự lái trong tương lai.
Tại LTS Global Digital Services, chúng tôi tự hào là một trong những công ty cung cấp dịch vụ chú thích dữ liệu hàng đầu tại Việt Nam cũng như tại khu vực Châu Á – Thái Bình Dương, đạt được nhiều giải thưởng uy tín và là đối tác đáng tin cậy của nhiều khách hàng lớn từ các thị trường như Mỹ, Đức, Hàn và Nhật. Chúng tôi cũng là một trong những công ty đầu tiên trên thế giới đạt được chứng nhận ISO/IEC FDIS 5259-4 từ tập đoàn DEKRA, khẳng định chất lượng dịch vụ chú thích dữ liệu mà LTS Global Digital Services cung cấp cho hệ thống AI và đặc biệt là trong lĩnh vực hệ thống hỗ trợ lái tiên tiến (ADAS).
Nếu bạn cần tư vấn thêm, hãy liên hệ ngay với chúng tôi để nhận được thông tin chi tiết!