Tham dự Tech Lounge

Tham dự Tech Lounge


Microsoft phát triển thuật toán máy tính có khả năng nhận diện vật thể chính xác hơn cả con người

ND Minh Đức
16/2/2015 4:59Phản hồi: 33
Microsoft phát triển thuật toán máy tính có khả năng nhận diện vật thể chính xác hơn cả con người
Tinhte-nhan-dien-vat-the-02.png
Một số hình ảnh mà hệ thống của nhóm có thể nhận diện chính xác theo yêu cầu

Các nhà nghiên cứu của Microsoft tuyên bố đã phát triển thành công một hệ thống máy tính đầu tiên khả năng nhận diện vật thể tốt hơn cả con người. Theo đó, đối với cùng một bài kiểm tra từ Image Net, nếu như con người có thể nhận diện vật thể trong khung cảnh với tỷ lệ lỗi là 5,1% thì hệ thống deep-learning của Microsoft có thể thực hiện hoạt động tương tự với tỷ lệ lỗi chỉ 4,94%.

Từ trước đến nay, bài kiểm tra của tổ chức Image Net được xem như tiêu chuẩn để đánh giá khả năng nhận biết vật thể thật của máy tính. Hồi giữa năm 2014, quán quân của bài kiểm tra này thuộc về hệ thống do các nhà nghiên cứu Google nắm giữ bằng hệ thống máy tính deep learning có khả năng xác định vật thể với tỷ lệ lỗi 6,66%. Cách đây không lâu, một nhóm nghiên cứu đến từ Trung Quốc cũng tuyên bố hệ thống của họ đã hạ tỷ lệ lỗi xuống chỉ 5,98%. Tuy nhiên, tất cả đều chưa vượt qua được khả năng của con người với tỷ lệ lỗi 5,1% (theo tiêu chuẩn của Image Net). Và lần này, nhóm nghiên cứu của Microsoft tuyên bố đã vượt qua được giới hạn này.

Trong thông cáo báo chí, các nhà nghiên cứu Microsoft cho biết: "Theo hiểu biết của chúng tôi, đây là lần đầu tiên một hệ thống máy tính có thể vượt mặt con người trong việc nhận diện các hình ảnh thị giác. Dưới góc độ khác, thuật toán của chúng tôi vẫn mắc phải những sai lầm trong quá trình nhận diện trong khi một số người có thể xác định dễ dàng. Cụ thể, đó là những trường hợp cần phải có nhận thức về bối cảnh phức tạp hoặc con người phải có kiến thức cao mới nhận ra đó là vật gì.

Tinhte-nhan-dien-vat-the-01.jpg
Một số hình ảnh mà hệ thống của nhóm đã có thể phân loại các đối tượng, nhưng không thể nhận diện chính xác vật thể theo yêu cầu

Nhóm cho biết thêm: "Mặc dù trên mặt số liệu, hệ thống của chúng tôi đã vượt mặt con người, nhưng điều đó không có nghĩa là máy tính có "thị giác" chính xác hơn con người. Tuy nhiên, kết quả này hứa hẹn tiềm năng dùng thuật toán có độ chính xác tương đương con người để thực hiện các nhiệm vụ đòi hỏi quan sát một cách chính xác."


Jian Sun, một thành viên trong nhóm nghiên cứu của Microsoft đã giải thích sự khác nhau cơ bản giữa thị lực của con người và cách thuật toán hoạt động: "Con người có thể dễ dàng phân biệt giữa cừu và bò. Nhưng, máy tính không thể làm được điều này một cách hoàn hảo. Tuy nhiên, khi nói đến cách phân biệt giữa các giống cừu khác nhau, máy tính sẽ thực hiện tốt hơn con người. Máy tính được "dạy" để nhìn vào chi tiết, kết cấu, hình dáng và bối cảnh của hình ảnh để phân biệt, trong khi đó con người khó có thể thực hiện được toàn bộ những động tác này."


Hệ thống nói trên có thể sẽ được mang tới hội nghị Structure Data diễn ra tại New York vào ngày 18, 19 tháng 3 sắp tới. Đây là nơi mà những cơ quan, tổ chức và công ty công nghệ lớn đều tham dự xoay quanh chủ đề phát triển trí tuệ nhân tạo có thể nhận biết, học hỏi. Hội nghị dự kiến sẽ có sự tham gia của các chuyên gia đến tư NASA, Facebook, Yahoo, Microsoft, Stanford,…

Tham khảo Gigaom, arxiv
33 bình luận
Chia sẻ

Xu hướng

Con người làm cho mọi thứ ngày càng thông minh hơn 😃
hauspeask
ĐẠI BÀNG
9 năm
@Bảo PN Mọi thứ đang làm cho người muốn khám phá nó nhiều hơn hehehe
CloudNine
TÍCH CỰC
9 năm
nhận diện vật thể trong ảnh là thuật toán rất cao siêu, không ngờ các anh ấy giỏi thật
@CloudNine Tìm một con kiến giữa 1 bầy mối @@
Hình như Google làm cái này trước rùi mà :| Cái gì chính xác đến 99% ý hôm trước tinh tế có đăng rùi.
@tung75605 Có đọc hết bài ko ?? Bài trên có ghi Google đầu tiên thì Google làm ra trước nhưng tỷ lệ lỗi 6.66%. Còn đây là Microsoft 4.94%
wao, tương lai phát triển thuật toán phân tích ngôn ngữ cơ thể, độ dãn đồng tử, nhịp tim thông qua chuyển động mao mạch, nhịp thở, giọng nói để suy ra đối tượng đang nghĩ gì, nói thật hay nói dối, tâm trạng ra sao bla bla bla rồi cài vào google glass là bá đạo lun =)). Đeo kính vào đi gặp gấu là biết ngay ẽm vừa ngủ vs thằng nào :v
LongOni
ĐẠI BÀNG
9 năm
@cuongfanandroid cuộc đời của Bác chỉ gặp toàn Gấu đi ngủ với thằng khác thôi hả
Chúc mừng Bác thành thánh đổ vỏ
@LongOni 😆 ờ số mình xui vãi vậy đó bác ơi, trước giờ bóc tem chừng 2, 3 con gì ah còn toàn bộ đống còn lại là đổ vỏ thôi 😃). đùa chứ 2015 rồi mà bác còn nghĩ chuyện đổ vỏ vs cả bóc tem thì cũng hơi lạ. mình thì 3 năm rồi chẳng quen con nào, chủ yếu 1 night stand thôi nên làm quái gì có con nào còn tem 😃). cơ mà k ràng buộc lại thay đổi thường xuyên cũng k đến nỗi tệ bác ah, gái tây tuy hơi béo nhưng kinh nghiệm ngon lành 😃) thỉnh thoảng vớ dc hàng ngon lắm hehe
Cowboyz
TÍCH CỰC
9 năm
Đôi mắt của Terminator đây!
@Cowboyz Bắt đầu thấy lo rồi
Dùng cái này chơi tìm điểm giống nhau thì vô đối là cái chắc :v
Những công nghệ thế này giúp nhận dạng lính bắn tỉa ẩn nấp trong chiến trường. Ví dụ một hệ thống quét qua một cảnh, nó sẽ nhận dạng xác suất cao có lính bắn tỉa núp, như vị trí cao, các "lỗ đen" bí ẩn trên tường. Ngay cả khi lính bắn tỉa ngụy trang và nằm yên, nếu nhìn kỹ vẫn có cái gì đó "ko tự nhiên", đặc biệt là khi lỡ chuyển mình, lập tức các "pattern" rằn ri di chuyển hàng loạt => đích thị là lính ẩn nấp. Vấn đề là con người mắt thường ko đủ thời gian, kiên nhẫn để dò hàng loạt những dấu hiệu này, máy móc tự động là thích hợp nhất. 😃
Thuật toán nhận dạng là 1 thuật toán rất khó. Trước mình làm 1 dự án nhận dạng số của các máy đo phóng xạ hơn nửa năm mới đạt được độ chính xác 89% - 95% (tại cái này làm cho smartphone nên thuật toán cần tối ưu rất nhiều). 90% nhận thức của con người về thế giới bên ngoài đến từ đôi mắt, 6% là từ âm thanh (cái này thì có các thuật toán detect tối ưu từ lâu rồi), còn lại là 4% (gồm có cảm xúc, xúc giác, biểu cảm nhưng những thứ này trong con người vô cùng hỗn độn khó xác định được true false trong từng trường hợp thế nên chắc còn rất rất lâu nữa robot mới có cảm xúc). Nếu ta làm được điều này thì robot đã hoàn toàn thay thế làm những việc của con người trong tương lai gần được rồi, kể cả nghiên cứu khoa học.
@v.m.quang Ở VN nghe có vẻ lạ tai nhưng cty mình chuyên dev về xử lý ảnh + xử lý âm thanh. Ở bên Nhật mấy cái này cực kỳ phát triển luôn. VD như 1 app mua hàng ở siêu thị. Chỉ cần lướt camera vào sp -> detect -> show info, sale off,... hoặc cái app chăm sóc cây lướt camera vào -> detect loại cây, loại bệnh,... -> thông tin, cách chăm sóc,...
@Yugi_pro_IT Bao giờ việt nam mình mới được vậy nhỉ
@Yugi_pro_IT Bạn ơi mình cũng đang nghiên cứu về xử lý hình ảnh và machine learning. bạn cho mình fb hoặc liên lạc có gì mình học hỏi với. 😁
@Yugi_pro_IT rất tốt nhưng rất tiếc gió lớn
HieuVoSG
ĐẠI BÀNG
9 năm
Microsofr bá đạo quá
quá hay...chờ xem những ứng dụng thực tiễn
techmaniac
ĐẠI BÀNG
9 năm
Bác đó phân tích khoa học và hợp lý mà các bác, có gì mà gió???
anh292003
TÍCH CỰC
9 năm
@techmaniac Trêu bác ấy tí
giúp gắn thêm một con mắt quan sát giống dương Tiễn
cuda123
TÍCH CỰC
9 năm
quá lợi hại ! quá lợi hại
trước h vẫn nghĩ ko có j lọt qua nổi đôi mắt con người, h thì có r. vẫn tưởng não người vs khả năng xử lý siêu việt kết hợp sự nhận thức có thể nhận ra mọi vật, mà h thua cả máy tính?!?
apovn
ĐẠI BÀNG
9 năm
Hay phết nhỉ
foxpro.ntt
ĐẠI BÀNG
9 năm
càng ngày càng thích Microsoft, âm thầm nghiên cứu những cái mới, cái hay, như 3D touch, hay cái Hololens kín tiếng đến nổi không một thông tin rò rỉ nào phát tán ra bên ngoài, đến khi công bố làm tất cả phải ngỡ ngàng, không phô trương, ầm ĩ như Glass của GG hay oto tự động lái, cuối cùng chả ứng dụng được vào đâu lại khai tử
AI sẽ ngày càng mạnh hơn
suzuki100602
ĐẠI BÀNG
9 năm
HIV
Khi Skynet hay vicky tìm và diệt, thì chắc con người khỏi nguỵ trang chi cho mất công.
Khó sống!!!
zantan
ĐẠI BÀNG
9 năm
Cái mạnh nhất của con người ngay cả trong phim luôn là khả năng tư duy, xử lý tình huống, nghĩ ra những thứ mà ko ai nghĩ ra hoặc ko tin là nó có thể làm đc (như máy bay, ô tô, hay xa hơn là hệ thống vũ trụ của Corpecnick, và mới đây là Hololens của Microsoft).

Còn các khả năng liên quan đến "máy móc" như là xử lý dữ liệu (tính toán đến hàng tỷ phép tính 1 giây) , nhận diện (màu sắc, âm thanh, hình ảnh),... đều ko thể qua nổi máy móc. Và tương lai khi AI vượt qua đc bộ não con người (những vấn đề ở trên) thì việc máy móc "tiêu diệt" con người là điều có thể hiểu đc, và thế giới khi đó gần với phim Matrix hơn là Terminator

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019