Giải pháp “theo vết bằng AI” của Viettel AI được cấp bằng sáng chế tại Mỹ
Lần đầu tiên, một sáng chế về theo vết đa đối tượng từ video do đội ngũ kỹ sư Việt Nam nghiên cứu và phát triển đã được Cơ quan Sáng chế và Nhãn hiệu Mỹ (USPTO) cấp bằng bảo hộ. Thành tựu này không chỉ khẳng định năng lực làm chủ công nghệ lõi của doanh nghiệp Việt, mà còn mở ra cơ hội đưa các giải pháp AI “Make in Vietnam” tham gia sâu hơn vào thị trường toàn cầu.
Trung tâm Dịch vụ Dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) – đơn vị trực thuộc Tập đoàn Công nghiệp – Viễn thông Quân đội (Viettel) – sáng 26/2 cho biết đã chính thức được United States Patent and Trademark Office (USPTO) cấp bằng sáng chế hữu ích (Utility Patent) cho giải pháp “Phương pháp học sâu cho theo vết đa đối tượng từ video”.
Đây là lần đầu tiên Viettel AI được cấp bằng sáng chế tại Mỹ – thị trường sở hữu hệ thống thẩm định sáng chế được đánh giá nghiêm ngặt và có tiêu chuẩn kỹ thuật hàng đầu thế giới. Sáng chế do chính đội ngũ nhân sự người Việt phát minh và làm chủ, xuất phát từ nhu cầu thực tiễn trong triển khai các hệ thống giám sát, phân tích video thông minh.
Bài toán khó của ngành thị giác máy tính
Trong lĩnh vực phân tích và giám sát video, theo vết đa đối tượng (Multiple Object Tracking – MOT) được xem là một trong những bài toán phức tạp nhất của thị giác máy tính. Công nghệ này không chỉ dừng lại ở việc phát hiện sự xuất hiện của người hay phương tiện trong khung hình, mà còn phải duy trì chính xác định danh của từng đối tượng xuyên suốt quá trình di chuyển.
Thách thức đặt ra khi đối tượng bị che khuất tạm thời, rời khỏi khung hình rồi quay lại, hoặc khi có nhiều người, nhiều phương tiện có đặc điểm tương đồng xuất hiện đồng thời. Trong môi trường ánh sáng thay đổi, không gian đông đúc, chuyển động nhanh hoặc góc quay phức tạp, hệ thống rất dễ xảy ra nhầm lẫn định danh.
Theo phân tích kỹ thuật, nhiều hệ thống hiện nay tiếp cận bài toán theo hướng chia nhỏ thành các bước xử lý riêng lẻ: phát hiện đối tượng, trích xuất đặc trưng, so khớp, rồi theo dõi. Cách làm này tiềm ẩn nguy cơ sai số tích lũy – chỉ cần một khâu gặp lỗi có thể kéo theo toàn bộ chuỗi theo dõi bị sai lệch. Đồng thời, việc xử lý tuần tự khiến thời gian phản hồi kéo dài, khó đáp ứng yêu cầu thời gian thực trong các ứng dụng thực tế.
Hướng tiếp cận “end-to-end” và tính mới của sáng chế
Trước những hạn chế đó, Viettel AI lựa chọn một hướng đi khác: thiết kế mô hình học sâu có khả năng huấn luyện đầu cuối (end-to-end). Thay vì tách rời từng bước xử lý, toàn bộ quá trình theo vết đa đối tượng được tích hợp trong một kiến trúc thống nhất.
Theo đại diện Viettel AI, cách tiếp cận này cho phép hệ thống học và tối ưu hóa đồng thời tất cả các thành phần trong chuỗi xử lý. Kết quả là độ ổn định được cải thiện, giảm nhầm lẫn định danh, tối ưu hóa thời gian xử lý và tăng khả năng thích ứng với điều kiện thực tế phức tạp.
Để được cấp bằng, sáng chế phải chứng minh được tính mới, mức độ sáng tạo và khả năng ứng dụng trong thực tế sản xuất, kinh doanh. Quy trình thẩm định tại USPTO thường kéo dài từ 2-3 năm, thậm chí lâu hơn đối với các giải pháp có độ phức tạp cao, và trải qua nhiều vòng đánh giá nghiêm ngặt.
Đáng chú ý, theo Viettel AI, sáng chế này được cấp bằng mà không phát sinh phản biện trong quá trình thẩm định. Điều đó cho thấy giải pháp có tính mới rõ ràng, phần mô tả kỹ thuật chặt chẽ và được đánh giá có rủi ro tranh chấp thấp – yếu tố đặc biệt quan trọng tại thị trường Mỹ.
Ứng dụng thực tiễn rộng rãi
Không dừng lại ở phòng thí nghiệm, công nghệ theo vết đa đối tượng bằng AI đã được triển khai trong nhiều giải pháp giám sát camera tại Việt Nam. Hệ thống hiện diện tại một số công sở, khu du lịch, trung tâm thương mại, cổng trường học, bệnh viện, tiệm vàng và các không gian công cộng.
Giải pháp cũng được tích hợp vào hệ thống quản lý đô thị thông minh tại một số tỉnh, thành phố. Thông qua phân tích video theo thời gian thực, hệ thống có thể tự động phát hiện các tình huống như xâm nhập trái phép vào khu vực cấm, hành vi trèo tường hoặc vượt rào, đổ rác không đúng nơi quy định, để quên đồ vật tại nơi công cộng hoặc bảo tàng.
Theo Viettel AI, trong quá trình triển khai thực tế, giải pháp có thể hỗ trợ phát hiện vi phạm an toàn giao thông hoặc nhận diện đám đông với độ chính xác trên 95%. Con số này cho thấy tiềm năng ứng dụng không chỉ trong đảm bảo an ninh, mà còn trong quản lý trật tự đô thị và tối ưu hóa vận hành hạ tầng.

Bước tiến về công nghệ AI “chủ quyền”
Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, nhận định việc được USPTO cấp bằng sáng chế phản ánh năng lực làm chủ công nghệ lõi của đội ngũ kỹ sư trong nước. Theo ông, đây là nền tảng quan trọng để xây dựng các công nghệ AI mang tính “chủ quyền” – do Việt Nam tự nghiên cứu, tự phát triển và tự làm chủ.
Trong bối cảnh cạnh tranh công nghệ toàn cầu ngày càng gay gắt, việc sở hữu bằng sáng chế tại Mỹ không chỉ có ý nghĩa bảo hộ quyền sở hữu trí tuệ, mà còn là “tấm hộ chiếu” giúp doanh nghiệp gia tăng uy tín khi tiếp cận thị trường quốc tế.
Thành tựu này cũng cho thấy sự dịch chuyển từ gia công, tích hợp công nghệ sang nghiên cứu và phát triển các giải pháp có hàm lượng tri thức cao, đủ khả năng đáp ứng cả yêu cầu trong nước lẫn tiêu chuẩn quốc tế.
Việc một doanh nghiệp Việt được cấp bằng sáng chế tại Mỹ cho giải pháp AI trong lĩnh vực thị giác máy tính là tín hiệu tích cực cho hệ sinh thái đổi mới sáng tạo trong nước. Khi các sản phẩm “Make in Vietnam” dần chinh phục được những thị trường khó tính, cơ hội mở rộng quy mô và tham gia sâu hơn vào chuỗi giá trị toàn cầu sẽ ngày càng rõ nét.
Hải Long