Giải mã AI qua góc độ Hệ thống hình thức: Vì sao máy móc không thông minh như ta tưởng? Bài viết bóc tách lớp phép thuật phía sau AI, qua đó tìm về vùng phi hình thức, nơi khẳng định giá trị độc bản của con người trong kỷ nguyên tự động hóa.
Mục Lục

by geralt on pixabay
Tóm tắt bài viết:
Bản chất của Trí tuệ nhân tạo: Khác với những lầm tưởng về một thực thể có ý thức, có tri giác, AI về bản chất là một Hệ thống hình thức (Formal Systems), một cỗ máy vận hành hoàn toàn dựa trên các quy tắc toán học và logic tất định.
AI có thực sự thấu hiểu ?: Dù sở hữu khả năng sinh văn bản hoặc hình ảnh ấn tượng, AI hiện đại thực chất chỉ đang thao tác với các Cú pháp dựa trên xác suất thống kê, hoàn toàn thiếu đi sự thấu hiểu về Ngữ nghĩa của chúng. Mặc dù những mô hình AI hiện đại có thể nén lượng dữ liệu khổng lồ được thể hiện qua khả năng học tập đáng kinh ngạc, điều đó không biến chúng thành những thực thể có sự thấu hiểu thực sự; chúng chỉ mô phỏng các cấu trúc và mối quan hệ trong dữ liệu chứ không nắm bắt bản chất hay ý nghĩa sâu xa của nó.
Giới hạn của Hệ thống hình thức: Theo những kết quả nền tảng của logic và lý thuyết thông tin, như Định lý Bất toàn Gödel, Độ phức tạp Kolmogorov và Hằng số Chaitin, mọi hệ thống hình thức đều có những chân lý hay tiên đề mà bản thân nó không thể tự chứng minh. Điều này cho thấy các hệ thống AI, dù mạnh đến đâu, vẫn bị ràng buộc trong khuôn khổ logic đã được xác định.
Định vị lại giá trị con người trong kỷ nguyên AI: Lợi thế cốt lõi của con người không nằm ở tốc độ xử lý hay khả năng ghi nhớ, mà ở những năng lực nằm ngoài phạm vi hình thức hay còn gọi là “phi hình thức”: Tri thức ẩn; trải nghiệm chủ quan; ý chí tự do; năng lực chịu trách nhiệm với quyết định (skin in the game); Nắm giữ sự sống, ý nghĩa và đặc biệt là khả năng JOOTS (Jumping Out Of The System), tức khả năng nhận ra giới hạn của một hệ quy tắc và thay đổi, vượt ra ngoài chính hệ quy tắc đó.
Phần 1: Bối cảnh
Vài năm gần đây, khi truy cập vào các nền tảng tin tức hay mạng xã hội, chúng ta không khó để bắt gặp những tiêu đề gây sốc: “Devin – Kỹ sư phần mềm AI đầu tiên ra mắt, đe dọa hàng triệu lập trình viên”, “Claude 3.5 Sonnet lập trình toàn bộ ứng dụng web trong vài giây”, hay “Sora tạo video chân thực đến mức có thể thay đổi ngành công nghiệp điện ảnh”.
Những sự hoang mang không chỉ đến từ những sản phẩm AI gây choáng ngợp. Bầu không khí căng thẳng này còn được thổi bùng lên bởi chính những phát ngôn của giới tinh hoa công nghệ. Elon Musk nhiều lần cảnh báo AI có thể trở thành mối đe dọa lớn hơn cả vũ khí hạt nhân. Sam Altman thừa nhận ông vừa phấn khích vừa kinh hãi trước tốc độ phát triển của các mô hình ngôn ngữ. Geoffrey Hinton, “bố già” của Deep Learning, thậm chí rời Google để được tự do cảnh báo về viễn cảnh con người mất quyền kiểm soát. Trong khi đó, Bill Gates khẳng định ngay cả những công việc trí óc từng được xem là bất khả xâm phạm nhất cũng không còn miễn nhiễm. Những cảnh báo này xuất hiện ngày càng nhiều khi các hệ thống AI tiến bộ nhanh chóng. (Altman, 2023; Hinton, 2023; Musk, 2024)
Sự cộng hưởng giữa những màn phô diễn sức mạnh thuật toán và những lời sấm truyền từ Thung lũng Silicon đã tạo ra một bầu không khí lo âu bao trùm lên lực lượng lao động toàn cầu. Nỗi sợ rằng AI sẽ không chỉ là công cụ hỗ trợ, mà sẽ trực tiếp thay thế con người, không còn là một viễn cảnh xa xôi trên màn ảnh sci-fi, mà đã hiện hữu ngay trong một tiếng tích tắc đếm ngược ở ngay thì hiện tại.
Đối với những người làm việc trực tiếp trong lĩnh vực công nghệ, cảm giác bất an này càng trở nên rõ rệt. Thật khó để giữ được sự bình tâm khi chứng kiến những khối lượng công việc đòi hỏi hàng tuần lao động trí óc của con người lại được tự động hóa chỉ bằng một câu lệnh prompt trong vài giây. Nó dễ dàng khiến chúng ta rơi vào một cuộc khủng hoảng hiện sinh, hoài nghi về giá trị thực sự của những kỹ năng và kiến thức mà bản thân đã dành nhiều năm để rèn giũa.
Tuy nhiên, giữa làn sóng FOMO (hội chứng sợ bị bỏ lỡ) và sự phóng đại hóa của truyền thông, tôi đã tìm về một khái niệm nền tảng trong toán học và triết học: Hệ thống hình thức (Formal Systems). Bằng việc đặt Trí tuệ nhân tạo quá khứ và hiện tại (và thậm chí có thể cả tương lai) dưới lăng kính của khái niệm này, những phép thuật bề ngoài bắt đầu tan biến, để lộ ra bản chất thực sự của một cỗ máy.
Bài viết này là một nỗ lực nhằm giải mã tận gốc cơ chế hoạt động của AI, thông qua đó, tái khẳng định những giá trị độc bản của con người mà không một hệ thống thuật toán nào có thể thay thế.
Phần 2: Hệ thống hình thức là gì ? Tại sao chúng ta cần phải biết và hiểu về khái niệm này ?
2.1 Định nghĩa của của Hệ thống hình thức
Trước khi đi sâu vào các ví dụ trực quan, chúng ta cần hiểu rõ khái niệm này dưới góc độ khoa học. Theo định nghĩa chung trong toán học, logic và khoa học máy tính (Formal System – Wikipedia):
Hệ thống hình thức (Formal System) là một mô hình toán học trừu tượng được sử dụng để biểu diễn các suy luận logic mà không cần quan tâm đến ý nghĩa nội tại của các đối tượng. Một hệ thống hình thức tiêu chuẩn bao gồm các thành tố sau:
Bảng chữ cái: Tập hợp các ký hiệu thô được sử dụng để xây dựng các công thức.
Ngôn ngữ hình thức: Các quy tắc xác định cách kết hợp các ký hiệu thành những công thức hợp lệ.
Tập hợp các tiên đề: Những mệnh đề được mặc định là đúng trong hệ thống.
Các quy tắc suy diễn: Các thuật toán cho phép biến đổi một chuỗi ký tự này thành một chuỗi ký tự khác.
2.2 Ví dụ đơn giản, dễ hiểu từ hàm số y = f(x)
Nghe khái niệm ở phần 2.1 hơi hàn lâm và khó hiểu đúng không ? Nhưng thực tế, mọi phép tính toán chúng ta từng học ở trường đều vận hành như một hệ thống hình thức thuần túy. Hãy thử phân tích một hàm số đơn giản y = f(x) qua 4 thành tố cốt lõi để thấy bản chất vô tri nhưng cực kỳ chính xác của nó:
Bảng chữ cái: Bao gồm tập hợp các con số (0 đến 9), các biến số (x, y) và các ký hiệu toán học (+, – , x, : , =). Đây là những nguyên liệu thô ban đầu.
Ngôn ngữ hình thức: Là các quy tắc viết phương trình sao cho “đúng cú pháp”. Ví dụ, viết y = 2x + 1 là hợp lệ, nhưng viết y = + + 2x là vô nghĩa. Hệ thống chỉ chấp nhận những chuỗi ký hiệu được sắp xếp đúng trật tự.
Tiên đề: Trong một bài toán cụ thể, giá trị đầu vào (Input) chính là chân lý tạm thời. Ví dụ, nếu ta gán x = 5, thì con số 5 này là điểm xuất phát không cần chứng minh. Hệ thống sẽ chấp nhận con số này làm nền tảng để bắt đầu vận hành.
Quy tắc suy diễn: Chính là các quy tắc tính toán (nhân chia trước, cộng trừ sau). Khi hệ thống thấy ký hiệu 2x, nó tự động thực hiện phép nhân dựa trên quy tắc đã định mà không cần thắc mắc tại sao.
Về bản chất, hàm f hoạt động như một cỗ máy xử lý chuỗi ký tự. Nó chỉ quan tâm đến hình dáng và vị trí của các ký hiệu (Cú pháp) để biến đầu vào x thành đầu ra y. Nó hoàn toàn không biết đến ý nghĩa thực tế (Ngữ nghĩa) của các con số đó. Đối với hàm f, x hay y có thể là số lượng quả táo, vận tốc chiếc xe, hay nhịp tim của một con người, điều đó không quan trọng.
Tương tự, trong lập trình, một trình biên dịch (compiler) khi chạy lệnh if (a > b) cũng không quan tâm a hay b mang cảm xúc gì; nó chỉ kiểm tra các giá trị nhị phân và rẽ nhánh một cách máy móc. Đây chính là đặc tính quan trọng nhất của hệ thống hình thức: Loại bỏ hoàn toàn sự mập mờ của ý nghĩa đời thực để đổi lấy sự chính xác tuyệt đối của logic.
Toán học, logic học, và các ngôn ngữ lập trình được xem là những hệ thống hình thức vĩ đại nhất của nhân loại. Chúng được tạo ra với mục đích cốt lõi: loại bỏ hoàn toàn sai số, sự mập mờ và cảm tính của con người khỏi các phép tính.
Chúng ta sẽ đến với ví dụ cụ thể nữa về Bàn cờ vua ở phần 2.3 để thấy rằng hệ thống hình thức tồn tại ở rất nhiều ngóc ngách trong đời sống.
2.2 Ví dụ từ Bàn cờ vua
Ảnh bởiHassan PashatrênUnsplash
Chúng ta hãy thử suy nghĩ về ví dụ bàn cờ vua vào đúng 4 thành tố của một hệ thống hình thức. Trong bàn cờ 64 ô vuông này, chúng ta có:
Bảng chữ cái: Chính là 32 quân cờ (Vua, Hậu, Xe, Mã, Tượng, Tốt) của hai bên. Đây là những thực thể thô, những ký hiệu cơ bản nhất của hệ thống.
Ngôn ngữ hình thức: Các vị trí và cách sắp xếp quân cờ hợp lệ trên bàn cờ. Ví dụ: Hai quân cờ không thể đứng cùng một ô, hoặc một quân cờ không thể nằm ngoài lưới 8×8. Một công thức hợp lệ ở đây là một thế cờ có thể xảy ra trong thực tế.
Tiên đề: Chính là cách sắp xếp các quân cờ ở vị trí bắt đầu ván đấu. Trong hệ thống này, vị trí xuất phát được mặc định là đúng và là điểm gốc của mọi suy diễn sau đó.
Quy tắc suy diễn: Chính là luật di chuyển của các quân cờ. Xe đi thẳng, Tượng đi chéo, Mã đi hình chữ L. Các quy tắc này cho phép biến đổi trạng thái của bàn cờ từ công thức này sang một trạng thái mới bằng công thức kia.
Đặc điểm quan trọng nhất của hệ thống này là tính tất định và phi cảm xúc. Một quân cờ không di chuyển vì nó muốn, mà vì quy tắc suy diễn cho phép nó làm vậy. Trong khoa học nhận thức, quá trình thao tác thuần túy với các quy tắc này được gọi là xử lý Cú pháp. Bàn cờ vua là minh chứng hoàn hảo cho một cỗ máy vật lý có thể tạo ra vô số kịch bản phức tạp chỉ từ những quy tắc vô tri. Tiếp theo, chúng ta sẽ bước vào một trong những thí nghiệm tư tưởng nổi tiếng và mang tính thách thức của lịch sử triết học hiện đại: Căn phòng Trung Hoa. Tôi tin rằng, nếu hiểu được sâu sắc bản chất của ví dụ này, bạn sẽ sở hữu một mảnh ghép quan trọng để giải mã gần như toàn bộ ý nghĩa của bài viết này.
2.3. Thí nghiệm Căn phòng Trung Hoa (The Chinese Room)
Ví dụ về bàn cờ vua hay hàm số y = f(x) giúp chúng ta hình dung rõ cấu trúc cơ học của một hệ thống hình thức. Khi một cỗ máy chơi cờ xuất sắc, chúng ta chỉ thán phục tốc độ tính toán của nó chứ không hề lo sợ hay cho rằng nó có linh hồn hay trí thông minh. Chúng ta nhận thức rất rõ nó chỉ đang vận hành theo các quy tắc logic suy diễn đã được định nghĩa.
Tuy nhiên, ranh giới của sự nhận thức bắt đầu bị bẻ cong khi các quy tắc hình thức khô khan này được áp dụng vào ngôn ngữ và giao tiếp. Ngôn ngữ vốn luôn được xem là lớp vỏ bọc của tư duy và cảm xúc con người. Khi một thuật toán có thể lắp ráp các từ ngữ thành một câu thơ dạt dào cảm xúc hay một lời an ủi trôi chảy, nó lập tức đánh lừa não bộ, tạo ra một ảo giác về sự thấu hiểu. Chúng ta dễ dàng lầm tưởng rằng cỗ máy đang thực sự “hiểu” những gì nó nói. Để vạch trần ảo giác này, triết gia John Searle đã đưa ra thí nghiệm tư tưởng Căn phòng Trung Hoa (1980).
Thí nghiệm được mô tả như sau: Tôi bị nhốt trong một căn phòng kín, hoàn toàn cách ly với thế giới bên ngoài. Qua một khe hở, những người bên ngoài đưa vào các tờ giấy ghi những câu hỏi bằng tiếng Trung Quốc. Vấn đề là, tôi hoàn toàn không biết một chữ tiếng Trung nào. Đối với tôi, những ký tự đó chỉ là những đường nét vô nghĩa.
Tuy nhiên, trong phòng được trang bị một cuốn cẩm nang quy tắc đồ sộ viết bằng ngôn ngữ mà tôi hiểu. Cuốn cẩm nang hướng dẫn chi tiết, Ví dụ:”Nếu nhận được chuỗi ký tự hình dáng A, hãy sao chép lại chuỗi ký tự hình dáng B và đưa ra ngoài”.
Tôi cần mẫn thực hiện quá trình đối chiếu và vẽ lại các ký tự theo đúng quy tắc mà cuốn sách hướng dẫn, sau đó gửi câu trả lời ra ngoài. Những người quan sát bên ngoài, sau khi đọc các câu trả lời hoàn hảo, sẽ kết luận rằng người trong phòng là một người thành thạo tiếng Trung.
Sự thật là gì? Tôi không hề thấu hiểu bất kỳ cuộc hội thoại nào đang diễn ra. Tôi chỉ đang thực thi các thao tác cú pháp một cách cơ học dựa trên bộ quy tắc, nhưng hoàn toàn thiếu đi sự thấu hiểu về ngữ nghĩa.
2.4. Nghịch lý giữa Mô phỏng kết quả và Thấu hiểu bản chất. Lỗ hổng của Phép thử Turing
Đến đây, một câu hỏi phản biện tất yếu sẽ được đặt ra: “Nếu hệ thống thực sự không hiểu gì, tại sao nó lại có đưa ra kết quả đúng? Kết quả đúng chẳng phải là minh chứng cho sự thấu hiểu sao?”.
Đây là một sự nhầm lẫn phổ biến giữa Mô phỏng kết quả và Thấu hiểu bản chất . Trong nhiều thập kỷ, giới khoa học đã quá tôn sùng Phép thử Turing , là một bài kiểm tra cho rằng nếu một cỗ máy có thể giao tiếp qua văn bản khiến con người không thể phân biệt được nó với người thật, thì cỗ máy đó được coi là có trí tuệ và có sự thấu hiểu (Turing, 1950).
Tuy nhiên, Căn phòng Trung Hoa (Searle, 1980) đã vạch trần lỗ hổng của Phép thử Turing: Hành vi bên ngoài (kết quả giao tiếp) không chứng minh được trạng thái nhận thức bên trong. Một chiếc máy tính cầm tay có thể thực hiện phép tính 12345 x 67890 trong chớp mắt và cho ra kết quả chính xác tuyệt đối. Nhưng chiếc máy tính đó không hề hiểu khái niệm về sự nhân lên, cũng không nhận thức được giá trị của con số 12345. Nó chỉ thực thi các thao tác đóng/mở cổng logic vật lý theo đúng thiết kế của kỹ sư.
Trong một hệ thống hình thức, một thực thể không cần phải thấu hiểu ngữ nghĩa để đưa ra đầu ra chính xác. Nó chỉ cần áp dụng hoàn hảo các quy tắc cú pháp. Máy móc đưa ra kết quả đúng vì bộ luật lệ (thuật toán) của nó được thiết kế đúng, chứ không phải vì nó sở hữu nhận thức. Giống như một chiếc máy photocopy tạo ra bản sao hoàn hảo của một luận án Tiến sĩ, điều đó không làm cho chiếc máy photocopy trở thành Tiến sĩ thực thụ.
Vậy câu hỏi đặt ra ở tiêu đề của phần này đó là: Tại sao tôi lại phải biết đến khái niệm Hệ thống hình thức và nó có ý nghĩa như thế nào đối với AI. Để giải đáp câu hỏi này, chúng ta sẽ đi đến phần 3.
Phần 3: Liệu AI có phải là một Hệ thống hình thức?
Nếu Phần 1 và 2 đã giúp chúng ta hiểu hệ thống hình thức là gì, thì câu hỏi tiếp theo là: Trí tuệ nhân tạo nằm ở đâu trong bức tranh đó? Nó có thật sự “hiểu” như con người vẫn tưởng, hay chỉ là một cỗ máy xử lý ký hiệu được nâng cấp đến mức rất tinh vi?
Câu hỏi này rất quan trọng, vì hầu hết sự kinh ngạc của chúng ta trước AI hiện nay đều đến từ cảm giác rằng nó đã vượt ra khỏi mức “máy móc thuần túy”. Nó biết viết, biết trả lời, biết lập trình, biết tóm tắt, biết làm thơ, thậm chí biết đối thoại rất tự nhiên. Nhưng cảm giác “giống người” đó có đồng nghĩa với việc nó thực sự hiểu không? Đó là điều cần làm rõ.
3.1. AI qua các thời kỳ: dù quá khứ hay hiện tại, vẫn là hệ thống hình thức
Trước hết, cần nói rõ rằng AI, dù là AI cổ điển hay AI hiện đại, vẫn không thoát khỏi bản chất của một hệ thống hình thức. Điểm khác biệt giữa chúng chủ yếu nằm ở quy mô và độ phức tạp, chứ không nằm ở nguyên lý nền tảng.
Với AI cổ điển, ta có thể lấy ví dụ từ các chương trình chơi cờ. Một hệ thống như Deep Blue được lập trình với luật chơi, cách đánh giá thế cờ, và các quy tắc lựa chọn nước đi. Khi thi đấu, nó không “hiểu” cờ vua theo nghĩa con người hiểu, mà chỉ duyệt qua rất nhiều khả năng có thể xảy ra rồi chọn phương án tối ưu theo các tiêu chí đã được con người đặt sẵn.
Nói đơn giản, nó giống như một người làm theo sách hướng dẫn cực kỳ chi tiết. Nếu gặp tình huống A thì làm B, nếu gặp C thì làm D. Nó không cần biết vì sao nước đi đó hay, chỉ cần biết rằng trong hệ quy tắc đã cho, đó là lựa chọn tốt nhất.
Với AI hiện đại, như các mô hình ngôn ngữ lớn hay Agentic AI, cơ chế bên trong phức tạp hơn nhiều, nhưng vẫn có thể phân tích bằng các thành tố của một hệ thống hình thức như đã nói ở phần 2.1.
Trước hết là bảng chữ cái. Đối với AI, ngôn ngữ không được xử lý dưới dạng câu hoàn chỉnh, mà được tách thành các đơn vị nhỏ gọi là token. Một token có thể là một từ, một phần của từ, hoặc thậm chí chỉ là một dấu câu. Có thể hình dung việc này giống như tháo rời một câu thành rất nhiều mảnh Lego nhỏ để máy có thể xử lý từng mảnh.
Tiếp theo là ngôn ngữ hình thức. Sau khi tách thành token, mỗi token được gán cho một vị trí trong một không gian toán học nhiều chiều, thường gọi là không gian vector. Trong không gian này, những token thường xuất hiện trong ngữ cảnh giống nhau sẽ có vị trí gần nhau.
Ví dụ, các từ như “vua”, “nữ hoàng” và “hoàng hậu” thường xuất hiện trong các văn bản có nội dung liên quan đến hoàng gia hoặc lịch sử, nên mô hình học được rằng chúng có xu hướng đi cùng nhau. Vì vậy, trong không gian vector, chúng được đặt gần nhau. Điều này không có nghĩa là mô hình hiểu ý nghĩa của các từ, mà chỉ phản ánh việc chúng có mẫu xuất hiện thống kê tương tự.
Tiên đề của hệ thống chính là dữ liệu huấn luyện và câu lệnh đầu vào. Mô hình không có nguồn tri thức nào khác ngoài những gì đã được học từ dữ liệu và những gì người dùng cung cấp trong câu hỏi. Nếu dữ liệu có sai lệch, mô hình vẫn sẽ học theo sai lệch đó.
Cuối cùng là quy tắc suy diễn. Trong các mô hình hiện đại, quy tắc này được thực hiện thông qua các phép toán ma trận rất lớn, trong đó cơ chế gọi là attention giúp mô hình quyết định phần nào của câu cần được chú ý nhiều hơn khi tạo ra từ tiếp theo.
Có thể hình dung attention giống như khi đọc một câu dài, ta không nhìn tất cả các từ với mức độ như nhau, mà tập trung vào những từ quan trọng để hiểu ý. Mô hình cũng làm điều tương tự, nhưng bằng tính toán xác suất xem từ nào có xác suất từ nào cao hơn và cho rằng nó là từ quan trọng, thay vì bằng sự hiểu biết.
Toàn bộ quá trình tạo ra câu trả lời thực chất là việc dự đoán token tiếp theo có xác suất cao nhất dựa trên những token đã có trước đó. Dù kết quả có vẻ rất tự nhiên, bản chất bên trong vẫn chỉ là thao tác trên ký hiệu theo các quy tắc toán học đã được xác định.
3.2 Vì sao AI có thể rất thông minh nhưng chúng vẫn không thật sự “hiểu”
Sau khi nhìn AI dưới góc độ một hệ thống hình thức, ta có thể đặt ra câu hỏi quan trọng hơn: nếu chỉ thao tác trên ký hiệu và xác suất, vì sao AI lại có thể trả lời trôi chảy đến mức khiến chúng ta có cảm giác nó hiểu? Câu trả lời nằm ở việc phân biệt giữa việc xử lý hình thức rất giỏi và việc thật sự có thấu hiểu.
Một cách hình dung rõ ràng là quay lại thí nghiệm Căn phòng Trung Hoa. Hãy tưởng tượng một người không biết tiếng Trung bị đặt trong một căn phòng kín. Người đó nhận được các câu hỏi viết bằng tiếng Trung, nhưng trong phòng có một cuốn sách hướng dẫn rất dày, ghi rõ rằng với mỗi dạng ký hiệu đầu vào thì phải viết ra dạng ký hiệu nào để trả lời.
Người trong phòng chỉ cần làm theo hướng dẫn. Anh ta không hiểu câu hỏi, cũng không hiểu câu trả lời, nhưng từ bên ngoài nhìn vào, hệ thống vẫn phản hồi hoàn toàn hợp lý. Với người quan sát, rất khó phân biệt giữa việc thật sự hiểu và việc chỉ làm đúng quy tắc.
Các mô hình ngôn ngữ hiện đại hoạt động theo cách tương tự, chỉ khác ở quy mô. Thay vì một cuốn sách quy tắc, chúng có hàng tỷ tham số được đúc kết từ việc nén một lượng dữ liệu khổng lồ. Thay vì tra cứu thủ công, chúng dùng phép tính xác suất để chọn ra token tiếp theo phù hợp nhất.
Khác biệt giữa “tìm ra quy luật” và “đạt tới sự thấu hiểu”.
Trong giới công nghệ có một quan điểm phổ biến: nếu một mô hình có thể nén một lượng dữ liệu khổng lồ vào tham số của nó, và từ đó dự đoán chính xác văn bản, thì nó phải “hiểu” thế giới ở một mức độ nào đó. Lập luận này thường được gọi bằng ý tưởng “compression is understanding” (Kolmogorov, 1965; Chaitin, 1975).
Lập luận này thoạt nhìn mang một sức thuyết phục ghê gớm: Để nén dữ liệu hiệu quả, hệ thống buộc phải trích xuất được những quy luật cốt lõi ẩn sau bề mặt hỗn loạn của thông tin. Theo logic đó, nếu đã tìm ra được quy luật, dường như hệ thống đã chạm đến bản chất của vấn đề. Tuy nhiên, ranh giới giữa việc trích xuất quy luật thống kê và thấu hiểu ý nghĩa thực chất là một vực thẳm về bản thể học mà các con số đơn thuần không thể khỏa lấp.
Để làm rõ sự khác biệt này, hãy xem xét sự kết hợp giữa hai trạng thái: Thao tác ký hiệu và Mô phỏng hành vi.
Hãy hình dung một nhân viên lưu trữ nhận được bản thảo khổng lồ viết bằng một loại cổ ngữ mà ông hoàn toàn không biết tiếng. Qua quan sát, ông nhận thấy một cụm ký hiệu phức tạp thường xuyên lặp lại. Để tiết kiệm không gian, ông đưa ra quy tắc: Mỗi khi cụm ký hiệu đó xuất hiện, ông sẽ thay thế nó bằng con số “1”. Về mặt kỹ thuật, người nhân viên đã thực hiện một quy trình nén dữ liệu hoàn hảo. Ông tìm ra quy luật, tối ưu hóa dung lượng và dự đoán chính xác sự xuất hiện của các ký hiệu tiếp theo, nhưng ông vĩnh viễn là một người lạ đối với nội dung tư tưởng của văn bản đó.
Sự vô tri này càng trở nên nguy hiểm khi nó được khoác lên lớp vỏ bọc trôi chảy. Hãy tưởng tượng một người nghe một bài hát bằng ngôn ngữ mà mình không hề biết. Sau hàng nghìn lần lắng nghe, anh ta có thể bắt chước lại hoàn hảo từng giai điệu, cách ngắt nhịp, thậm chí phát âm vô cùng chính xác. Anh ta đã học được mẫu âm thanh và tái tạo nó một cách xuất sắc khiến người nghe lầm tưởng anh ta là một nghệ sĩ bản địa dạt dào cảm xúc. Nhưng thực tế, anh ta không hề có bất kỳ trải nghiệm hay sự thấu cảm nào với ý nghĩa của lời bài hát.
Đây chính là bản chất của các mô hình ngôn ngữ lớn (LLMs). Chúng đọc một lượng văn bản khổng lồ để tìm ra các mẫu xác suất xuất hiện lặp đi lặp lại. Khi khả năng dự đoán đạt đến độ chính xác siêu việt, kết quả tạo ra trông như có ý nghĩa sâu sắc, khiến con người rơi vào cái bẫy “nhân hóa” máy móc. Thực tế, AI chỉ đang thực hiện một quá trình “hát nhép” tri thức: Nó thao tác trên hình dáng của các mảnh ghép ngôn ngữ (Cú pháp) giống như người nhân viên lưu trữ, và trình diễn nó một cách mượt mà như người ca sĩ học vẹt, trong khi hoàn toàn không có bất kỳ trải nghiệm thực tế nào về thế giới mà nó đang nói tới.
Sự thành công của AI không đến từ sự thấu hiểu thực tại, mà đến từ khả năng khai thác cấu trúc thống kê của các cú pháp ở một quy mô vượt xa giới hạn của con người.
Hiện tượng “vẹt xác suất”
Khái niệm “stochastic parrots” (Bender et al., 2021) được đưa ra để mô tả hiện tượng này. Một con vẹt có thể lặp lại lời nói của con người mà không cần hiểu. Mô hình ngôn ngữ cũng vậy, nhưng thay vì lặp lại nguyên văn, nó tạo ra câu mới dựa trên xác suất của các mẫu đã học.
Khi ta hỏi vì sao bầu trời màu xanh, mô hình không nhìn thấy bầu trời. Nó không có cảm giác về màu sắc. Nó chỉ nhận ra rằng trong dữ liệu huấn luyện, cụm từ đó thường đi cùng với những từ như tán xạ, ánh sáng, khí quyển. Từ đó, nó ghép lại thành một câu trả lời có vẻ rất hợp lý.
Điều khiến con người dễ nhầm lẫn là vì ngôn ngữ của chúng ta vốn đã chứa sẵn ý nghĩa. Khi một hệ thống tái tạo đúng cấu trúc ngôn ngữ, ta tự động gán cho nó sự hiểu biết. Nhưng đó là một suy luận tâm lý của người quan sát, dù AI có thể nén dữ liệu rất tốt và tái tạo ngôn ngữ rất thuyết phục, điều đó vẫn không đủ để kết luận rằng nó hiểu theo nghĩa con người hiểu. Nó là một cỗ máy xử lý ký hiệu cực kỳ mạnh, nhưng vẫn là một cỗ máy nằm bên trong một hệ thống hình thức.
3.3 Ảo giác về sự thấu hiểu
Nếu AI thực chất chỉ là một hệ thống hình thức, tại sao chúng ta vẫn thường có cảm giác rằng nó đang thật sự hiểu? Nguyên nhân nằm ở một khuynh hướng tâm lý đã được ghi nhận từ rất sớm: con người có xu hướng gán ý thức và cảm xúc cho bất kỳ hệ thống nào có thể giao tiếp trôi chảy. Hiện tượng này từng xuất hiện ngay từ thời các chatbot đơn giản như ELIZA, khi người dùng dễ dàng tin rằng chương trình đang lắng nghe và thấu cảm, dù nó chỉ phản hồi theo mẫu có sẵn (Weizenbaum, 1966).
Hiệu ứng này càng mạnh hơn với các hệ AI hiện đại, vì chúng được trình diễn trong những điều kiện rất lý tưởng. Đầu vào thường rõ ràng, ngữ cảnh được kiểm soát, và nhiệm vụ được mô tả đủ chi tiết để hệ thống có thể xử lý tốt. Trong môi trường như vậy, việc mô hình tạo ra câu trả lời mạch lạc dễ khiến ta lầm tưởng rằng nó thực sự hiểu vấn đề.
Tuy nhiên, khi bước ra khỏi những tình huống được kiểm soát, các hệ thống này dễ bộc lộ điểm yếu: trả lời sai nhưng rất tự tin, hiểu nhầm ngữ cảnh, hoặc tạo ra thông tin không tồn tại. Những hiện tượng này cho thấy hành vi giống hiểu không đồng nghĩa với có hiểu, mà chỉ phản ánh giới hạn của một hệ thống đang thao tác trên ký hiệu theo xác suất.
Phần 4. Giới hạn của Hệ thống hình thức (và cũng là giới hạn của AI)
Mọi hệ thống hình thức, dù được thiết kế tinh vi đến đâu, đều tồn tại trong những giới hạn không thể vượt qua do chính cấu trúc logic của nó. Những giới hạn này không phải do thiếu dữ liệu hay thiếu sức mạnh tính toán, mà là những ràng buộc đã được chứng minh trong toán học và khoa học máy tính. Khi hiểu rõ các giới hạn này, chúng ta sẽ thấy rằng năng lực của trí tuệ nhân tạo, dù ấn tượng đến đâu, vẫn nằm trong phạm vi của các hệ thống hình thức, và vì vậy không thể bao trùm toàn bộ những gì con người có thể làm.
4.1 Định lý Bất toàn Gödel, độ phức tạp Kolmogorov và hằng số Chaitin
4.1.1 Giới hạn thứ nhất: Định lý Bất toàn Gödel
Năm 1931, Kurt Gödel công bố Định lý Bất toàn, một trong những kết quả quan trọng nhất của logic hiện đại. Định lý này cho thấy rằng trong bất kỳ hệ thống hình thức nào đủ mạnh để mô tả số học, tức là đủ mạnh để mã hoá mọi quá trình tính toán và suy luận bên trong chính hệ thống đó, luôn tồn tại những mệnh đề đúng nhưng không thể được chứng minh là đúng bằng chính các tiên đề và quy tắc của hệ thống đó. Nói cách khác, không thể xây dựng một hệ thống tri thức hoàn chỉnh trong đó mọi chân lý đều có thể suy ra từ một tập tiên đề hữu hạn.
Hệ quả đầu tiên là mọi hệ thống hình thức đều phải bắt đầu từ các tiên đề. Tiên đề là những giả định được chấp nhận là đúng nhưng không thể tự chứng minh từ bên trong hệ thống. Một khi các tiên đề đã được đặt ra, hệ thống có thể suy luận rất chính xác dựa trên chúng, nhưng không thể tự kiểm tra xem điểm xuất phát của mình có đúng hay không.
Giới hạn này xuất hiện rất rõ trong các hệ thống AI hiện đại. Mọi mô hình đều được tối ưu theo một hàm mục tiêu do con người định nghĩa. Hệ thống có thể tối ưu cực kỳ hiệu quả, nhưng không thể tự quyết định liệu mục tiêu đó có hợp lý, có đạo đức, hay có phù hợp với thực tế hay không.
4.1.2 Giới hạn thứ hai: Chiếc hộp hữu hạn của Kolmogorov và Chaitin
Giới hạn thứ hai phơi bày bản chất tĩnh tại của các cỗ máy tính toán, được làm rõ trong Lý thuyết thông tin thuật toán gắn liền với Gregory Chaitin và Andrey Kolmogorov (1965, 1975). Để hiểu được giới hạn này, chúng ta cần nắm bắt hai khái niệm nền tảng: Độ phức tạp Kolmogorov và Hằng số Chaitin.
Độ phức tạp Kolmogorov và ví dụ bức tranh điểm màu
Độ phức tạp của một sự vật (hay một mệnh đề) được hiểu đơn giản là độ dài của bản mô tả ngắn nhất (hoặc chương trình máy tính ngắn nhất) có thể sinh ra nó.
Hãy tưởng tượng bạn phải mô tả một bức tranh qua điện thoại để người khác vẽ lại:
Độ phức tạp Kolmogorov thấp: Nếu bức tranh có quy luật lặp lại hoàn hảo: Cứ 1 điểm màu đỏ lại đến 1 điểm màu xanh, liên tục cho đến hết. Thay vì phải liệt kê 1.000 màu, bạn chỉ cần nói: “Lặp lại cặp màu (Đỏ, Xanh) 500 lần.” Dù dữ liệu thực tế rất lớn (1.000 điểm màu), nhưng “bản nén” hay “bản mô tả” của nó cực ngắn (Là một ví dụ trực quan hóa tiêu biểu cho cách huấn luyện AI hiện đại). Đây là loại thông tin có quy luật và cấu trúc cao.
Độ phức tạp Kolmogorov cao: Nếu đó là một bức tranh hỗn loạn với hàng nghìn điểm màu ngẫu nhiên không theo bất kỳ quy luật nào, bạn không thể dùng một câu lệnh ngắn gọn. Cách duy nhất để mô tả nó là đọc tên tọa độ và màu sắc của từng điểm ảnh một. Trong trường hợp này, bản thân bức tranh chính là bản mô tả ngắn nhất của nó.
Ví dụ trên cho thấy cùng là hai bức tranh có 1000 điểm màu nhưng độ phức tạp (bản mô tả) của chúng lại hoàn toàn khác nhau. Điều đó chứng tỏ kích thước và độ lớn của thông tin (dữ liệu) không nói lên được độ phức tạp của nó.
Hằng số Chaitin và Nghịch lý chiếc thước kẻ 20cm
Từ nền tảng của Kolmogorov, Gregory Chaitin đã chứng minh một định lý khốc liệt: Trong một hệ thống hình thức hữu hạn, tồn tại một giới hạn tuyệt đối về độ phức tạp thông tin mà hệ thống có thể chứng minh. Cụ thể, một hệ thống có độ phức tạp chứa N bit thông tin thì vĩnh viễn không thể chứng minh hay tạo ra những chân lý đòi hỏi nhiều hơn N bit.
Chaitin đưa ra khái niệm Hằng số Chaitin (xác suất dừng của một chương trình máy tính). Đây là một con số có thật, tồn tại chính xác, nhưng chúng ta vĩnh viễn không thể tính toán được nó bằng bất kỳ cỗ máy nào. Tại sao? Vì để tìm ra chữ số thứ N của Hằng số này, hệ thống của bạn cần có độ phức tạp lớn hơn chính nó. Việc cố gắng dùng một cỗ máy tính toán hữu hạn để vươn tới tri thức vô hạn giống hệt như việc bạn cầm một chiếc thước kẻ hữu hạn dài 20cm để đo đạc chính xác khoảng cách giữa hai thiên hà. Công cụ hình thức đó vĩnh viễn không đủ tầm vóc để chạm tới thực tại mà nó đối diện.
Khi chiếu hệ quy chiếu toán học này vào các mô hình AI hiện đại, giới hạn N bit thông tin chính là tập hợp dữ liệu huấn luyện, kiến trúc thuật toán và số lượng tham số mà con người nạp vào.
Hãy hình dung hệ thống AI giống như một chiếc hộp đồ chơi có N khối Lego. Dữ liệu lịch sử và các tham số chính là N khối Lego có sẵn trong hộp. Từ những khối hữu hạn đó, AI có khả năng lắp ráp và tạo ra hàng triệu biến thể lộng lẫy khiến chúng ta choáng ngợp: một tòa lâu đài, một phi thuyền, hay một kịch bản viễn tưởng phức tạp.
Nhưng toán học đã chỉ rõ bản chất của sự “sáng tạo” này: Nó thuần túy là quá trình khai thác lại và nội suy những mảnh ghép đã được mã hóa sẵn trong hệ thống. Dù lắp ghép tài tình đến đâu, AI không thể tự sinh ra một khối Lego thứ N+1 mang màu sắc hoàn toàn mới hay một chất liệu chưa từng tồn tại trong hộp.
4.1.3 Giới hạn thứ ba: Logic hình thức
Trong hệ thống nhị phân của máy tính, một mệnh đề và phủ định của nó không thể cùng đúng. Khi mâu thuẫn xuất hiện, hệ thống phải dừng, báo lỗi hoặc chọn một nhánh. Tuy nhiên, đời sống thực lại đầy những mâu thuẫn. Con người có thể vừa tin vừa nghi, vừa yêu vừa ghét, vừa muốn thay đổi vừa muốn giữ nguyên. Theo chủ nghĩa Marx – Lenin, mâu thuẫn lại chính là nguồn gốc cho sự vận động, phát triển của sự vật, hiện tượng.
4.1.4 Kết luận
Từ Gödel đến Chaitin, từ tiên đề đến độ phức tạp Kolmogorov, toán học hiện đại cho thấy rằng mọi cỗ máy suy luận dựa trên hệ thống hình thức đều có những giới hạn nội tại. AI có thể rất mạnh trong việc xử lý ký hiệu và tối ưu hóa, nhưng nó vẫn hoạt động bên trong những giới hạn đó. Nó có thể suy luận hiệu quả trong khuôn khổ đã được đặt ra, nhưng không thể tự bước ra ngoài khuôn khổ để kiểm chứng chính mình. Nếu nhân loại cần một bước nhảy vọt thì máy móc vĩnh viễn không thể tự sinh ra nó. Giới hạn của AI chính là chiếc hộp N khối Lego mà chúng ta cấp cho nó. Từ đây dẫn tới khái niệm JOOTS để nạp thêm những “bit thông tin lớn hơn N” mà chúng ta sẽ nói đến ở phần 5.5.
4.2 Từ giới hạn của hệ thống hình thức đến câu hỏi về con người
Nếu mọi hệ thống hình thức đều có giới hạn, và nếu trí tuệ nhân tạo về bản chất là một hệ thống hình thức cực kỳ lớn, thì câu hỏi tự nhiên xuất hiện là: con người có bị ràng buộc bởi cùng loại giới hạn đó hay không.
Nếu con người cũng chỉ là một hệ thống hình thức phức tạp hơn, thì về nguyên tắc, mọi năng lực của con người đều có thể được mô phỏng khi đủ dữ liệu và đủ sức mạnh tính toán. Nhưng nếu trong nhận thức con người tồn tại những yếu tố không thể rút gọn hoàn toàn thành quy tắc, thì sẽ tồn tại một miền mà các hệ thống tự động khó có thể chạm tới.
Để trả lời câu hỏi này, cần phân biệt giữa hai loại hoạt động khác nhau: những hoạt động có thể được mô tả hoàn toàn bằng quy tắc, và những hoạt động không thể rút gọn hoàn toàn thành quy tắc. Sự phân biệt này dẫn đến khái niệm vùng phi hình thức, nơi kinh nghiệm, ý nghĩa và quyết định không thể được biểu diễn trọn vẹn bằng ký hiệu.
Chính từ đây, chúng ta chuyển sang câu hỏi quan trọng hơn: nếu AI bị giới hạn bởi hệ hình thức, thì điều gì trong con người nằm ngoài giới hạn đó, và điều đó có ý nghĩa gì trong kỷ nguyên trí tuệ nhân tạo.
Phần 5. Định vị lại giá trị con người: Vùng “phi hình thức”
Ảnh bởiRyoji IwatatrênUnsplash
Câu hỏi được đặt ra ở cuối phần trước mang tính quyết định: liệu con người có đơn thuần chỉ là một hệ thống hình thức phức tạp hơn cỗ máy? Nếu đúng như vậy, việc chúng ta bị thay thế hoàn toàn chỉ còn là vấn đề thời gian, khi sức mạnh tính toán và lượng dữ liệu vượt qua một ngưỡng tới hạn.
Tuy nhiên, khi đối chiếu nhận thức của con người với chính các giới hạn toán học đã ràng buộc mọi hệ thống hình thức, có thể thấy rằng hai thứ này không hoàn toàn đồng nhất. Những gì Gödel, Chaitin hay Kolmogorov chỉ ra không chỉ là giới hạn của máy, mà là giới hạn của mọi hệ thống suy luận thuần hình thức. Nếu con người có thể vận hành vượt qua những giới hạn đó, thì trong nhận thức của chúng ta phải tồn tại một miền không thể rút gọn hoàn toàn thành quy tắc. Miền này có thể gọi là vùng phi hình thức, nơi ý nghĩa, kinh nghiệm và quyết định không thể được mô tả trọn vẹn bằng ký hiệu.
Các đặc điểm dưới đây của Vùng phi hình thức cho thấy vì sao nhận thức con người không thể đồng nhất với một hệ thống hình thức:
5.1 Năng lực vượt qua mâu thuẫn và tái cấu trúc tiên đề
Trong một hệ thống hình thức, sự xuất hiện của mâu thuẫn là dấu hiệu của lỗi. Nếu một mệnh đề và phủ định của nó cùng đúng, hệ thống sẽ mất tính nhất quán và không còn suy luận được. Máy tính vì thế luôn phải hoạt động trong logic nhị phân chặt chẽ.
Tư duy con người lại khác. Trong đời sống thực, chúng ta có thể đồng thời giữ những niềm tin chưa hoàn toàn tương thích, có thể vừa tin vừa nghi, vừa muốn thay đổi vừa muốn giữ nguyên. Những trạng thái như vậy không làm tâm trí sụp đổ, mà thường trở thành động lực để tìm cách hiểu mới. Nhiều bước tiến trong khoa học và triết học bắt đầu từ việc nhận ra rằng các giả định cũ không còn phù hợp.
Điểm quan trọng hơn là con người có khả năng tự chất vấn các tiên đề của chính mình. Một hệ thống hình thức không thể chứng minh tính đúng đắn của tập tiên đề mà nó đang dùng, như Gödel đã chỉ ra. Con người, bằng năng lực phản tư, có thể đặt lại câu hỏi về mục tiêu, giá trị hay niềm tin mà mình từng cho là hiển nhiên. Việc có thể thay đổi điểm xuất phát cho thấy nhận thức của con người không bị khóa trong một hệ quy tắc cố định.
5.2 Trải nghiệm chủ quan và sự thấu hiểu ngữ nghĩa
Một hệ thống xử lý ký hiệu có thể mô tả chính xác mọi thuộc tính vật lý của một hiện tượng, nhưng điều đó không đồng nghĩa với việc nó biết trải nghiệm hiện tượng đó là như thế nào. Trong triết học tâm trí, những khía cạnh này thường được gọi là qualia, tức trải nghiệm chủ quan không thể rút gọn hoàn toàn thành mô tả đại diện hay thông tin vật lý (Qualia, Stanford Encyclopedia of Philosophy). Sự khác biệt giữa mô tả và trải nghiệm cho thấy nhận thức không chỉ là thao tác trên dữ liệu.
Con người không chỉ biết thông tin về thế giới, mà còn sống trong thế giới bằng thân thể và cảm giác của mình. Quan điểm này chính là trọng tâm của hard problem of consciousness, theo đó việc giải thích cảm nhận có chủ thể không dễ dàng chỉ bằng mô tả cấu trúc hay chức năng (Hard problem of consciousness, Wikipedia). Việc nhìn thấy một màu sắc, cảm nhận một âm thanh hay trải qua một nỗi đau đều có một chiều kích chủ quan không thể rút gọn hoàn toàn thành công thức. Chính chiều kích này tạo ra ý nghĩa, và cũng là nền tảng của sự thấu hiểu ngữ cảnh.
Nếu nhận thức chỉ là xử lý cú pháp, thì việc biết mọi dữ kiện phải tương đương với việc hiểu. Nhưng trong thực tế, hiểu theo nghĩa trải nghiệm luôn nhiều hơn những gì có thể viết thành lời.
5.3 Ý chí, thấu cảm và trách nhiệm
Các hệ thống tự động hoạt động bằng cách tối ưu hóa một hàm mục tiêu đã được xác định (thuật ngữ này chỉ mục đích được lập trình cho AI làm hướng dẫn trong quá trình học), và thường được nghiên cứu trong lĩnh vực AI alignment (AI alignment, Wikipedia). Chúng không tự lựa chọn mục tiêu, và cũng không cảm nhận hậu quả của quyết định. Khi kết quả sai, hệ thống không chịu mất mát nào ngoài việc bị điều chỉnh lại mà không chịu mất mát thực tế, thậm chí có thể tận dụng lỗ hổng mục tiêu để đạt chỉ số định nghĩa (Reward hacking, Wikipedia).
Con người lại luôn hành động trong điều kiện có rủi ro. Mỗi quyết định đều gắn với hậu quả thực tế đối với bản thân và người khác. Từ đó xuất hiện khái niệm trách nhiệm. Chúng ta cân nhắc không chỉ vì logic, mà vì những gì có thể xảy ra nếu lựa chọn sai.
Sự thấu cảm cũng bắt nguồn từ việc cùng chia sẻ một thế giới sống. Ta hiểu nỗi đau của người khác không chỉ vì biết định nghĩa của đau, mà vì chính mình có thể đau. Những yếu tố này khiến việc ra quyết định của con người không thể được mô tả đầy đủ bằng một hàm tối ưu đơn giản.
5.4 Tri thức ẩn
Không phải mọi tri thức đều tồn tại dưới dạng quy tắc rõ ràng. Nhiều kỹ năng chỉ được hình thành qua trải nghiệm, qua tương tác xã hội và qua việc đối mặt với những tình huống không thể dự đoán trước, đó là bản chất của tri thức ẩn (tacit knowledge), loại tri thức mà ta biết cách làm nhưng khó diễn đạt bằng lời hay biểu diễn hoàn chỉnh bằng ký hiệu (Polanyi, 1966)
Mọi hệ thống AI hiện đại, dù là mạng nơ-ron phức tạp nhất, đều vận hành dựa trên tri thức hiện (explicit knowledge), loại tri thức đã được đóng gói thành văn bản, con số hoặc ký hiệu. Khi chúng ta cố gắng chuyển đổi tri thức ẩn thành dữ liệu để huấn luyện máy tính, chúng ta thực chất đang thực hiện một quá trình nén thông tin có mất mát.
Những gì tinh túy nhất của kỹ năng, sự nhạy bén của trực giác, khả năng đọc vị bối cảnh trong tích tắc hay cảm thức về đạo đức thường bốc hơi ngay khi chúng ta cố gắng diễn đạt chúng thành lời. AI hiện mới chỉ học được cái bên ngoài của kỹ năng thông qua các mô tả ký hiệu, chứ không nắm bắt được sự thấu hiểu thực tại. Điều này cho thấy trong nhận thức con người tồn tại một tầng tri thức không hoàn toàn nằm trong phạm vi của hệ thống hình thức.
5.5 Khả năng bước ra khỏi hệ thống (JOOTS)
Theo Hofstadter (1979), một hệ thống hình thức chỉ có thể suy luận bên trong các quy tắc của chính nó. Khi gặp bế tắc, nó chỉ có thể tiếp tục thử trong cùng không gian quy tắc đó. Con người có thể làm điều khác: nhìn lại chính hệ quy tắc đang dùng và thay đổi nó.
Khả năng này xuất hiện khi ta nhận ra rằng vấn đề không nằm ở việc tính toán chưa đủ, mà ở chỗ cách đặt vấn đề chưa đúng. Khi đó, lời giải đến từ việc thay đổi góc nhìn, chứ không phải từ việc lặp lại cùng một phép suy luận. Năng lực bước ra khỏi hệ quy chiếu cho thấy nhận thức con người không bị đóng kín trong một hệ hình thức duy nhất.
Chính sự tồn tại của những đặc điểm trên cho phép nói rằng trong nhận thức con người có một vùng phi hình thức, nơi kinh nghiệm, ý nghĩa và quyết định không thể được mô tả trọn vẹn bằng một hệ thống quy tắc hữu hạn.
Một ví dụ nổi tiếng về JOOTS là hệ thống MIU (Hofstadter, Gödel, Escher, Bach; xem Wikipedia) . Hệ thống này chỉ có ba ký tự M, I, U, một tiên đề ban đầu là MI và một số quy tắc biến đổi. Bài toán đặt ra là liệu có thể biến MI thành MU bằng cách áp dụng các quy tắc hay không.
Một hệ thống thuần hình thức sẽ thử mọi khả năng có thể. Nó sẽ tạo ra hàng loạt chuỗi mới, tiếp tục áp dụng quy tắc và tìm kiếm vô hạn mà không biết khi nào nên dừng.
Con người có thể giải bài toán theo cách khác. Thay vì tiếp tục biến đổi, ta quan sát cấu trúc của hệ thống và nhận ra rằng số lượng chữ I trong mọi chuỗi sinh ra từ MI sẽ không bao giờ chia hết cho 3, trong khi MU có 0 chữ I. Từ đó có thể kết luận rằng MU là không thể đạt được.
Điểm quan trọng ở đây là lời giải không xuất hiện từ bên trong hệ thống, mà từ việc nhìn hệ thống như một đối tượng. Đây chính là khả năng bước ra khỏi hệ thống.
5.6. Sự sống và Ý nghĩa
Khi thừa nhận khả năng vượt trội của các hệ thống AI ở hiện tại và tương lai, chúng ta không nhằm mục đích chấp nhận sự lụi tàn của giá trị nhân bản. Ngược lại, việc phân tích về hệ thống hình thức chính là một lời nhắc nhở đầy hy vọng về những gì thực sự tạo nên con người. Ngay cả khi trí tuệ nhân tạo có thể chạm tới một sự mô phỏng hoàn hảo về con người, sự tồn tại của con người vẫn mang một vẻ đẹp nguyên bản mà máy móc vĩnh viễn không thể thay thế.
Nghịch lý mô phỏng và “Cơn mưa” của John Searle Để hiểu rõ sự khác biệt này, chúng ta cần nhìn lại phản biện đanh thép của triết gia John Searle: Một bản mô phỏng trên máy tính về một cơn mưa rào sẽ không bao giờ làm bạn bị ướt (Searle, 1980). Một hệ thống siêu trí tuệ có thể tính toán và mô phỏng hoàn hảo mọi biểu hiện của nỗi đau hay niềm hạnh phúc, nhưng nó vẫn mãi là một thực thể được tạo ra để tính toán về ý nghĩa chứ không phải để chiếm lĩnh ý nghĩa.
Con người không học về nỗi buồn hay tình yêu thông qua dữ liệu; chúng ta nếm trải chúng qua từng nhịp thở, qua sự hữu hạn của thân xác và dòng chảy vô thường của thời gian. Chúng ta không chỉ xử lý ý nghĩa, chúng ta chính là ý nghĩa đó. Chính sự mong manh của sự sống đã tạo ra sức nặng cho mọi lựa chọn của con người, một loại “chi phí sinh tồn” mà máy móc vĩnh cửu, dù có sức mạnh tính toán vô hạn, cũng khó lòng nếm trải trọn vẹn.
Sự rực rỡ khởi nguồn từ sự bất toàn Nếu các hệ thống hình thức được thiết kế để trở nên hoàn hảo và tối ưu, thì con người lại rực rỡ chính vì sự bất toàn của mình. Những sai lầm, những lựa chọn phi logic và khả năng ôm ấp những mâu thuẫn biện chứng, vốn là lỗi trong mắt một hệ thống logic, lại chính là nguồn gốc kiến tạo nên nghệ thuật, triết học và tình yêu.
Một thế giới chỉ có những câu trả lời đúng tuyệt đối của một siêu trí tuệ sẽ là một thế giới tĩnh lặng. Ngược lại, chính sự sống của con người mang đến sự nhiễu loạn đầy sáng tạo, biến thực tại thành một bản nhạc với những nốt thăng trầm không thể đoán định.
Sự phát triển của trí tuệ nhân tạo, vì vậy, không phải là một “gáo nước lạnh” dội vào niềm tự tôn nhân loại, mà là một tấm gương soi vĩ đại. Nó buộc chúng ta phải trân trọng vùng phi hình thức của chính mình, thứ mà bấy lâu nay ta coi là hiển nhiên. AI có thể chiếm lĩnh đỉnh cao của logic và trí tuệ, nhưng con người sẽ mãi mãi nắm giữ vị thế độc tôn của Sự sống và Ý nghĩa. Chúng ta không tồn tại để trở thành những cỗ máy hoàn hảo; chúng ta tồn tại để định nghĩa thế nào là một thực tại đáng sống.
Phần 6: Chiến lược thích nghi trong kỷ nguyên AI
Ảnh bởiBoliviaInteligentetrênUnsplash
Nếu phần lớn sức mạnh của AI nằm ở khả năng xử lý hình thức, còn con người có thêm vùng phi hình thức, thì chiến lược hợp lý không phải là cạnh tranh với máy ở phần nó làm tốt nhất. Thay vào đó, con người cần định vị lại giá trị của mình dựa trên những năng lực khó tự động hóa.
6.1 Không cạnh tranh với máy móc ở tốc độ xử lý, tính toán
Những công việc có thể mô tả hoàn toàn bằng quy tắc sẽ ngày càng được tự động hóa. Khi nhiệm vụ chỉ bao gồm tiếp nhận dữ liệu, áp dụng quy trình có sẵn và tạo ra kết quả theo mẫu, máy tính gần như luôn làm nhanh và chính xác hơn.
Vì vậy, thay vì cố gắng làm nhanh hơn máy, hợp lý hơn là sử dụng AI để xử lý phần thao tác hình thức, để con người tập trung vào những phần đòi hỏi hiểu bối cảnh, đánh giá tình huống và chịu trách nhiệm cho quyết định.
6.2 Nắm vững tri thức nền tảng
Khi sử dụng AI, con người phải đóng vai trò kiểm chứng và phản biện. Một hệ thống có thể tạo ra câu trả lời hợp lý về mặt thống kê, nhưng điều đó không đảm bảo rằng câu trả lời đúng trong thực tế. Muốn đánh giá kết quả, người sử dụng cần hiểu bản chất vấn đề ở mức nguyên lý.
Tri thức nền tảng giúp nhận ra khi một lập luận chỉ đúng trong một số điều kiện, hoặc khi một lời giải nghe hợp lý nhưng thực chất sai. Nếu thiếu hiểu biết cốt lõi, con người rất dễ trở thành người chỉ lặp lại kết quả do máy sinh ra.
6.3 Xây dựng niềm tin, thấu cảm và trách nhiệm
Trong nhiều lĩnh vực, giá trị của con người không nằm ở tốc độ làm việc mà ở khả năng chịu trách nhiệm cho quyết định của mình. AI có thể đưa ra đề xuất, nhưng không thể gánh hậu quả thay cho người sử dụng.
Niềm tin giữa con người với con người được xây dựng từ việc dám đưa ra quyết định và chấp nhận rủi ro cùng nhau. Sự thấu cảm trong giao tiếp, khả năng hiểu hoàn cảnh cụ thể và cân nhắc yếu tố đạo đức là những điều khó có thể thay thế bằng thuật toán.
6.4 Khả năng thích nghi, học tập suốt đời và sáng tạo không ngừng
Trong một thế giới mà các thao tác và kỹ năng hình thức dần bị thâu tóm bởi tự động hóa, tri thức chuyên môn không còn là thứ có thể “học một lần rồi dùng mãi”. Lợi thế dài hạn của con người giờ đây nằm ở khả năng thích nghi, học tập suốt đời và sáng tạo không ngừng , đây chính là những năng lực biểu hiện của JOOTS (Jumping Out Of The System).
Khả năng JOOTS cho phép chúng ta lùi lại một bước để quan sát toàn bộ hệ thống từ bên ngoài thay vì bị đóng khung trong nó. Khi những quy trình quen thuộc không còn phù hợp với thực tại, con người không chỉ cố gắng chạy nhanh hơn trong hệ quy tắc cũ; chúng ta sẵn sàng học lại, điều chỉnh góc nhìn và kiến tạo nên một hệ tiên đề mới. Sáng tạo thực sự thường xuất hiện chính trong những tình huống như vậy: khi một vấn đề được nhìn từ một khung tham chiếu hoàn toàn khác với trước đây.
Chúng ta sẽ không chỉ giải quyết vấn đề mà còn định nghĩa lại vấn đề (tiên đề). Chính năng lực “nhảy ra ngoài hệ thống” này giúp chúng ta giữ vững vai trò chủ động, dẫn dắt và tạo ra những giá trị mà máy móc chưa từng được lập trình để thấy. Đừng cố gắng trở thành một cỗ máy hoạt động hoàn hảo; hãy trở thành một người dám bước ra khỏi khuôn mẫu để định hình lại tương lai.
Phần 7: Lời kết của bài viết
Sự phát triển của Trí tuệ nhân tạo là một thực tế không thể đảo ngược. Nhiều công việc mang tính lặp lại và có thể mô tả bằng các quy tắc sẽ dần được tự động hóa. Tuy nhiên, việc nhìn nhận AI dưới góc độ một hệ thống hình thức không nhằm phủ nhận giá trị của công nghệ, mà để giúp chúng ta hiểu rõ giới hạn của nó và sử dụng nó một cách tỉnh táo.
AI là một công cụ cực kỳ mạnh trong việc tra cứu, xử lý dữ liệu và nhận diện mẫu. Khi để máy móc làm đúng phần việc của máy móc, con người có điều kiện tập trung vào những năng lực khó hình thức hóa hơn: khả năng hiểu bối cảnh, ý nghĩa, sự thấu cảm, trực giác, sáng tạo và trách nhiệm đối với quyết định của mình.
Giá trị của con người không biến mất trong kỷ nguyên AI, nhưng nó dịch chuyển. Những ai chỉ lặp lại quy trình có sẵn sẽ dễ bị thay thế, còn những ai có khả năng thích nghi, chấp nhận mâu thuẫn, học từ trải nghiệm, và chịu trách nhiệm cho lựa chọn của mình. Khi công nghệ ngày càng hoàn thiện ở tầng hình thức, những năng lực thuộc về vùng phi hình thức lại càng trở nên quan trọng. Không phải vì chúng mới xuất hiện, mà vì trước đây chúng ta chưa từng bị buộc phải nhận thức điều này rõ ràng đến vậy.
Cảm ơn bạn đọc đã dành thời gian để đọc đến đây. Bài viết này được hình thành từ quá trình tìm hiểu và trao đổi với các mô hình ngôn ngữ lớn, kết hợp với việc tổng hợp tài liệu từ nhiều nguồn khác nhau. Rất mong nhận được các ý kiến phản biện của bạn đọc để mỗi chúng ta có thêm nhiều góc nhìn đa dạng và sâu sắc về chủ đề này.
Tác giả có sử dụng công cụ AI để hỗ trợ biên tập và tóm tắt tài liệu.
Tài liệu tham khảo
Formal System – Wikipedia
Gödel, Kurt (1931). On Formally Undecidable Propositions of Principia Mathematica and Related Systems.
Kolmogorov, Andrey (1965). Three approaches to the quantitative definition of information.
Chaitin, Gregory (1975). A theory of program size formally identical to information theory.
Searle, John (1980). Minds, Brains, and Programs. (Chinese Room Argument, phản biện Strong AI)
Bender, Emily M.; Gebru, Timnit; McMillan-Major, Angelina; Mitchell, Margaret (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?
Jackson, Frank (1982). Epiphenomenal Qualia. (Mary’s Room / Knowledge Argument)
Qualia. Stanford Encyclopedia of Philosophy.
Hard problem of consciousness. Wikipedia
AI alignment. Wikipedia.
Reward hacking. Wikipedia.
Chalmers, David (1995). Facing Up to the Problem of Consciousness.
Polanyi, Michael (1966). The Tacit Dimension.
Hofstadter, Douglas (1979). Gödel, Escher, Bach: An Eternal Golden Braid. (JOOTS – Jumping Out Of The System)
Weizenbaum, J. (1966). ELIZA – A computer program for the study of natural language communication between man and machine. Communications of the ACM, 9(1), 36-45.
Để lại một bình luận