Một đột phá khoa học trong đọc tư duy: Phát minh ra các tiện ích mà mọi người đều có thể mua
Một đột phá khoa học trong đọc tư duy: Phát minh ra các tiện ích mà mọi người đều có thể mua

Video: Một đột phá khoa học trong đọc tư duy: Phát minh ra các tiện ích mà mọi người đều có thể mua

Video: Một đột phá khoa học trong đọc tư duy: Phát minh ra các tiện ích mà mọi người đều có thể mua
Video: Những thực phẩm vàng giúp tăng cường trí nhớ, não bộ khỏe mạnh | VTC Now 2024, Có thể
Anonim

Các kỹ sư từ Viện Nghiên cứu Hoạt động Thần kinh Cấp cao đã có thể tạo ra một hệ thống chuyển suy nghĩ thành lời nói dễ hiểu và dễ nhận biết. Bằng cách kiểm soát hoạt động não của ai đó, công nghệ sẽ tái tạo lại suy nghĩ thành lời nói.

Bước đột phá khoa học này, cùng với sức mạnh của AI và bộ tổng hợp giọng nói, sẽ mở ra một kỷ nguyên mới trong sự tương tác giữa máy tính và não bộ. Tất nhiên, điều này cũng mở ra cơ hội mới cho những người vì lý do này hay lý do khác mà mất khả năng nói.

“Giọng nói của chúng ta giúp giữ liên lạc với bạn bè, gia đình và thế giới xung quanh chúng ta, vì vậy, việc mất giọng nói do chấn thương hoặc bệnh tật là điều rất nguy hiểm đối với mọi người. Tuy nhiên, với kho kiến thức ngày nay, chúng ta có một cách tiềm năng để khôi phục sức mạnh này. Chúng tôi đã chứng minh rằng với công nghệ phù hợp, suy nghĩ của con người có thể được giải mã và hiểu bởi bất kỳ người nghe nào,”Nima Mesgarani, Tiến sĩ và một trong những tác giả của một nghiên cứu được thực hiện tại Viện Hành vi Tâm thần Mortimer B. Zuckerman tại Columbia. Trường đại học.

Nhiều thập kỷ nghiên cứu đã chỉ ra rằng khi mọi người nói, hoặc thậm chí tưởng tượng rằng họ đang thốt ra từ, các mô hình hoạt động đặc trưng xuất hiện trong não của họ. Một kiểu tín hiệu rõ ràng và dễ nhận biết cũng nảy sinh khi chúng ta nghe ai đó nói hoặc tưởng tượng rằng chúng ta đang nghe. Các chuyên gia đã cố gắng giải mã những hình mẫu này trong nhiều thập kỷ, nhưng chỉ bây giờ một tương lai đã mở ra trước mắt, trong đó những suy nghĩ không còn có thể ẩn bên trong não mà thay vào đó có thể được dịch sang ngôn ngữ nói theo ý muốn.

Nhưng để đạt được kỳ tích này không hề dễ dàng. Những nỗ lực ban đầu để giải mã tín hiệu não của Tiến sĩ Mesgarani và những người khác tập trung vào các mô hình máy tính đơn giản phân tích các hình phổ, là những hình ảnh đại diện cho các tần số âm thanh.

Nhưng do cách tiếp cận này không tạo ra bất cứ thứ gì gần giống với giọng nói dễ hiểu, thay vào đó, nhóm của Tiến sĩ Mesgarani đã chuyển sang sử dụng bộ mã hóa giọng nói, một thuật toán máy tính có thể tổng hợp giọng nói sau khi được đào tạo để ghi lại các cuộc trò chuyện của mọi người.

Tiến sĩ Mesgarani, đồng thời là phó giáo sư kỹ thuật điện tại Trường Kỹ thuật và Khoa học Ứng dụng Columbia thuộc Fu Foundation cho biết: “Đây là công nghệ tương tự mà Amazon Echo và Apple Siri sử dụng để trả lời các câu hỏi của chúng tôi bằng lời nói.

Để dạy cho bộ mã hóa thần kinh diễn giải hoạt động của não, Tiến sĩ Mesgarani đã hợp tác với Ashesh Dinesh Mehta, M. D., Tiến sĩ, bác sĩ giải phẫu thần kinh tại Viện Khoa học Thần kinh của Northwell Health Physician Partners và là đồng tác giả của bài báo hôm nay. Bác sĩ Mehta điều trị cho những bệnh nhân mắc chứng động kinh, một số người trong số họ phải trải qua các cuộc phẫu thuật thường xuyên.

Tiến sĩ Mesgarani cho biết: “Làm việc với Tiến sĩ Mehta, chúng tôi đã yêu cầu những bệnh nhân động kinh đã phẫu thuật não lắng nghe những gợi ý từ những người khác nhau trong khi chúng tôi đo lường các mô hình hoạt động não của họ. "Những mô hình thần kinh này đã đào tạo ra vocoder."

Sau đó, các nhà nghiên cứu yêu cầu những bệnh nhân tương tự lắng nghe những người nói phát âm các số từ 0 đến 9 trong khi ghi lại các tín hiệu não sau đó có thể được truyền qua một máy phát âm thanh. Âm thanh do bộ mã hóa tạo ra để phản hồi lại các tín hiệu này được phân tích và tinh chỉnh bằng cách sử dụng các mạng thần kinh như trí thông minh nhân tạo bắt chước cấu trúc của tế bào thần kinh trong não sinh học.

Kết quả cuối cùng là một giọng nói robot lặp lại một chuỗi số. Để xác minh tính chính xác của đoạn ghi âm, Tiến sĩ Mesgarani và nhóm của cô đã hướng dẫn mọi người nghe đoạn ghi âm và tường thuật lại những gì họ nghe được.

Tiến sĩ Mesgarani cho biết: “Chúng tôi phát hiện ra rằng con người có thể hiểu và lặp lại âm thanh khoảng 75% thời gian, điều này vượt trội hơn nhiều so với bất kỳ nỗ lực nào trước đây. Sự cải thiện về mức độ rõ ràng đặc biệt rõ ràng khi so sánh các bản ghi âm mới với các lần thử trước đó dựa trên biểu đồ quang phổ. "Một bộ mã hóa cảm ứng nhạy cảm và mạng lưới thần kinh mạnh mẽ đã đại diện cho những âm thanh mà bệnh nhân nghe được ban đầu với độ chính xác đáng kinh ngạc."

Tiến sĩ Mesgarani và nhóm của cô hiện có kế hoạch kiểm tra những từ và câu khó hơn. Họ cũng có ý định thực hiện các bài kiểm tra tương tự đối với các tín hiệu não phát ra khi một người nói hoặc tưởng tượng lời nói. Cuối cùng, họ hy vọng hệ thống của họ có thể là một phần của thiết bị cấy ghép, tương tự như hệ thống được đeo bởi một số bệnh nhân động kinh, giúp chuyển trực tiếp suy nghĩ của người đeo thành lời nói.

Tiến sĩ Mesgarani cho biết: “Trong trường hợp này, nếu chủ nhân của con chip nghĩ, 'Tôi cần một cốc nước', hệ thống của chúng tôi có thể thu nhận các tín hiệu não do suy nghĩ đó tạo ra và chuyển chúng thành lời nói tổng hợp bằng lời nói. "Đó là một yếu tố thay đổi cuộc chơi và đối với bất kỳ ai bị mất khả năng nói do chấn thương hoặc bệnh tật, công nghệ mang đến một cơ hội mới để giao tiếp với thế giới xung quanh họ."

Bình luận biên tập của The Big The One:Vì một số nhân viên của chúng tôi có mối quan hệ nhất định với sinh lý học thần kinh, chúng tôi hoàn toàn có thể khẳng định chắc chắn rằng việc giải quyết vấn đề đọc suy nghĩ và chuyển những suy nghĩ này thành từ ngữ không phải là vấn đề mà một số tiến sĩ triết học có thể giải quyết cùng với một bác sĩ giải phẫu thần kinh thông minh. Đây là nhiệm vụ của viện nghiên cứu, một trăm, hai trăm năm hoặc hơn nữa sẽ giải quyết được. Hơn nữa, hoàn toàn không phải là thực tế là viện nghiên cứu sẽ giải quyết được vấn đề này - ngay cả khi tất cả các siêu máy tính của NASA được đưa đến đó, trên đó một đám đông kỹ sư sẽ bắt đầu mô phỏng mạng nơ-ron. Tuy nhiên, một bài báo trên tạp chí khoa học sẽ không nói dối và thực tế ghi nhận những suy nghĩ là điều chắc chắn có. Vậy làm thế nào, hai sự thật này có thể được kết hợp với nhau?

Rất đơn giản. Trong 20-30 năm gần đây, một số lượng khổng lồ các công nghệ hoàn toàn khó tin và rất phức tạp như bộ vi xử lý và ổ cứng đã xuất hiện trên thế giới. Và mỗi ngày, càng có nhiều phát minh mới xuất hiện, được viết cho một số "sinh viên tài năng", những người ngồi trong ga ra, đã thu thập được một phần từ sắt vụn, mà các viện nghiên cứu đã phải vất vả trong suốt 50 năm. Và trong trường hợp này, chúng ta có một phát minh về nguồn gốc tương tự. Đó là, một sự phát triển đã được thực hiện (hoặc chuyển giao cho con người) trong nhiều năm bởi một người nào đó không rõ, nhưng đã được viết ra cho một người cô và chú từ Colombia.

Trên thực tế, hoàn toàn không có sự khác biệt nào mà Wikipedia sẽ viết là "nhà phát minh" của công nghệ. Điều chính là công nghệ đã được trình bày với thế giới bằng cách sử dụng một tạp chí khoa học. Xa hơn nữa, một số công ty Trung Quốc sẽ bắt đầu sản xuất những "tiện ích" như vậy sẽ khiến mọi người quen với ý tưởng rằng đầu họ giờ đã trở nên hoàn toàn minh bạch. Cuối cùng, giai đoạn thứ ba sẽ là Orwellian "1984" khi ngay cả suy nghĩ của bất kỳ người nào cũng có thể thoải mái đọc được từ xa. Ví dụ, bằng cách đặt các cảm biến đặc biệt trong căn hộ hoặc tích hợp một con chip đặc biệt phản ứng với các xung động của não vào cơ thể. Hơn thế nữa.

Theo quy luật, mỗi công nghệ có một ứng dụng ngược lại. Ví dụ, nếu có một công nghệ chuyển đổi các xung thần kinh thành lời nói, thì bằng cách sử dụng nguyên tắc tương tự, bạn có thể biến bất kỳ từ nào thành suy nghĩ của ai đó. Trong tình huống này, tổng thống của các quốc gia khác nhau có một viễn cảnh to lớn là được toàn bộ cử tri ủng hộ tuyệt đối, vì bây giờ có một cơ hội kỹ thuật để khiến mọi cử tri thậm chí nghĩ như ông ấy - chỉ cần đặt một tín hiệu được điều chế chính xác vào ổ cắm là đủ..

Nói chung, những gì cần nói - những triển vọng cho thế giới đang mở ra một cách tuyệt vời nhất và chúng tôi đang theo dõi sự phát triển của các sự kiện một cách quan tâm.

Đề xuất: