Trevor Paglen và miền ảo giác của AI tạo sinh
Liệu các mô hình ảo giác trong sản xuất hình ảnh dựa trên AI có khả năng làm chúng ta càng xa lạ, nếu không nói là bị cô lập, khỏi thế giới hay không?
· 12 phút đọc · lượt xem.
Liệu các mô hình ảo giác trong sản xuất hình ảnh dựa trên AI có khả năng làm chúng ta càng xa lạ, nếu không nói là bị cô lập, khỏi thế giới hay không?
Mở đầu
Nếu một hình ảnh có thể được mô tả là ám ảnh, thì tác phẩm Rainbow của Trevor Paglen hoàn toàn phù hợp với điều đó. Ngoài phần bầu trời có vẻ như độc hại, một số phần của nó dường như đã biến dạng thành dấu vết cháy nổ hoặc, bí ẩn hơn, thành một loạt những lỗi kỹ thuật. Tên đầy đủ của tác phẩm, Rainbow (Corpus: Omens and Portents) gợi ý về sự tập hợp của các yếu tố tự nhiên và một cơ thể vật lý, có thể là một xác chết (corpus/corpse), làm tăng thêm cảm giác xa lạ và lo lắng chung.
Cùng với các tác phẩm khác trong loạt tác phẩm Adversarially Evolved Hallucinations của Paglen (2017 – nay), bao gồm tác phẩm quái dị Vampire (Corpus: Monsters of Capitalism) và Human Eyes (Corpus: The Humans) – tác phẩm sau cùng đi kèm với hình ảnh của đôi mắt tưởng như nhìn thấy nhưng thực ra không thấy – Rainbow được tạo ra bởi một mạng đối kháng sinh tạo (GAN), một mô hình AI huấn luyện mạng nơron để nhận diện, phân loại và, quan trọng hơn, tạo ra các hình ảnh mới.
Mạng đối kháng sinh tạo (GAN) là một mô hình học máy được phát triển bởi Ian Goodfellow và các cộng sự vào năm 2014. GAN bao gồm hai mạng nơ-ron chính: mạng sinh tạo (generator) và mạng phân loại (discriminator). Mạng sinh tạo có nhiệm vụ tạo ra dữ liệu mới (như hình ảnh hoặc âm thanh) từ các dữ liệu đầu vào ngẫu nhiên, trong khi mạng phân loại sẽ đánh giá dữ liệu do mạng sinh tạo tạo ra và xác định xem chúng có phải là dữ liệu thực hay không.
Hai mạng này hoạt động theo cơ chế đối kháng, nghĩa là mạng sinh tạo cố gắng cải thiện khả năng tạo ra dữ liệu chân thực hơn, trong khi mạng phân loại nỗ lực cải thiện khả năng phân biệt giữa dữ liệu thật và giả. Quá trình này diễn ra liên tục cho đến khi mạng sinh tạo tạo ra dữ liệu mà mạng phân loại không thể phân biệt được, từ đó tạo ra những sản phẩm chất lượng cao và đa dạng. GAN đã được áp dụng trong nhiều lĩnh vực, từ tạo hình ảnh nghệ thuật đến cải thiện chất lượng video và tạo âm thanh.
Khi mà các mô hình xử lý hình ảnh AI không trải nghiệm thế giới như chúng ta, mà thay vào đó tái tạo một phiên bản bị sai lệch, các hình ảnh chúng tạo ra tiết lộ mức độ mà AI tái hiện những ẩn dụ bất an về thế giới của chúng ta. Xuất phát từ không gian sơ khai của sản xuất hình ảnh tự động, những hình ảnh như Rainbow tiết lộ điều thường bị ẩn giấu hoặc bị che khuất – một hiện tượng, hay một cơn ác mộng, mà nợ nần sự logic ảo giác và thường sai lầm của các thuật toán điều khiển AI. Mặc dù thường bị coi là lỗi kỹ thuật, nhưng logic này là một phần cơ bản của AI, chứ không chỉ là một hiệu ứng phụ. Tất cả điều này dẫn đến một câu hỏi tổng quát: Liệu các mô hình ảo giác trong sản xuất hình ảnh dựa trên AI có khả năng làm chúng ta càng xa lạ, nếu không nói là bị cô lập, khỏi thế giới hay không?
Văn hóa hình ảnh vô hình
Một nghệ sĩ danh tiếng và là người nhận học bổng MacArthur, Trevor Paglen đã luôn dấn thân vào việc khám phá những điều vô hình và bị che khuất trong thế giới của chúng ta, bao gồm cả cái mà ông gọi là văn hóa hình ảnh vô hình của những hình ảnh do máy móc tạo ra mà mắt người không thể giải mã.
Trong cuộc triển lãm năm 2019 của ông From ‘Apple’ to ‘Anomaly’, Paglen đã làm nổi bật cách mà các thuật toán – những bộ mã lệnh – thường xuyên sinh ra các mô hình AI thiên lệch. Suốt dự án, ông mang lại cho khán giả và các nhà nghiên cứu cơ hội hiểu rõ mức độ mà con người hiện đại bị định hình và xác lập qua những mô hình máy học có thiên kiến, dù là về chủng tộc hay các yếu tố khác, bất chấp sự thiết kế và giả định không đáng tin cậy của chúng. Trong loạt tác phẩm Adversarially Evolved Hallucinations của mình, Paglen cũng quan tâm đến các yếu tố tiềm ẩn và bí mật, ông thực hiện phương pháp kỹ thuật đảo ngược: làm việc ngược từ phiên bản cuối cùng của một hình ảnh như Rainbow, ông khám phá cách mà qua việc tổng hợp tập dữ liệu, sự huấn luyện của GAN được thiết kế để tạo ra những hình ảnh mới, chưa từng thấy. Bằng cách đó, loạt tác phẩm này minh họa các quy trình bị ảnh hưởng bởi những thiên kiến trong tập dữ liệu (nơi một số hình ảnh bị đại diện quá mức hoặc thiếu đại diện), sự khác biệt trong quy trình huấn luyện tổng thể, và đáng chú ý là những điều chỉnh thường bị ẩn đi trong quá trình áp dụng trọng số thuật toán vào dữ liệu đầu vào.
Cách để khai thác, áp dụng máy học vào cuộc sống
Dù có những hạn chế và thiên kiến cố hữu của máy học (chưa kể đến xu hướng ảo giác), chúng ta ngày càng dựa vào các công nghệ này để dự đoán và ảnh hưởng đến cuộc sống của chúng ta. Thông qua phân tích thống kê các mẫu hành vi trong quá khứ, nhằm tính toán và nhận dạng các mẫu hành vi tương lai, các dự đoán cơ giới về danh tính, sở thích mua sắm, điểm tín dụng, triển vọng nghề nghiệp, hành vi hàng ngày, tình trạng sức khỏe, quan điểm chính trị và khả năng cực đoan hóa dần trở thành chuẩn mực hơn là ngoại lệ. Xu hướng dự đoán của công nghệ AI, theo hướng này, có nguy cơ trở thành tự thực hiện và không thể kiểm soát, nếu không nói là không thể hiểu được.
Hệ quả của các tính toán dựa trên máy móc rất sâu sắc, đặc biệt khi chúng cố gắng dự đoán không chỉ các hành vi hàng ngày mà còn những hành vi nằm ngoài chuẩn mực – những hành vi, hoạt động, và danh tính chống lại các khuôn mẫu định sẵn. Bằng cách phơi bày lý do quyết định của các mô hình AI trong việc sản xuất hình ảnh – đây là cầu vồng; đây là quả táo; đây là khuôn mặt; đây là mối đe dọa – và cách chúng áp đặt ý nghĩa lên thế giới, hành động tưởng chừng như trừu tượng của sự phân loại sai hoặc ảo giác có tác động rất thực đến cách chúng ta sống cuộc sống của mình. Di sản của sự áp đặt này, ảnh hưởng tri thức của nó, không thể bị đánh giá thấp: Khi được triển khai trong công nghệ nhận diện khuôn mặt, chẳng hạn, các hệ thống này gán một phân loại cho một đối tượng hoặc thực thể cụ thể – một khuôn mặt – và gán cho nó một cái tên hoặc, đáng lo ngại hơn, một mức độ đe dọa.
Logic vận hành của GAN
Do đó, thường có xu hướng coi những phân loại này là hiển nhiên và tiếp tục – tức là đánh dấu một số mẫu hành vi nhất định – theo các dự đoán và đề xuất tự động của chúng. Khi trình bày thế giới theo những suy luận tính toán của mạng nơron, các mô hình xử lý hình ảnh AI như GAN đang lập trình, hoặc điều chỉnh, mọi người và cộng đồng để chấp nhận những suy đoán của máy móc. Nói tóm lại, chúng ta đang được chuẩn bị để coi các giả định tính toán là sự thật về thế giới của chúng ta thay vì, như thực tế, là một dự đoán có điều kiện dựa trên những dự đoán xác suất và các hoạt động mờ ám của thuật toán.
Logic vận hành của GAN, quan trọng là, đặc biệt hướng tới việc tạo ra những hình ảnh mới, chưa từng thấy, điều này càng khiến quy trình bị chi phối bởi một mức độ ngẫu nhiên tính toán đáng kể. Mặc dù có cảm giác về tính tất định công nghệ thường liên quan đến các thiết bị thuật toán (như nhận diện người một cách chính xác và dự đoán tranh cãi về các sự kiện tương lai), các quy trình liên quan không tự động mang lại kết quả có thể dự đoán được hoặc thậm chí là chính xác.
Chúng ta, nói ngắn gọn, đang được chuẩn bị để coi các giả định tính toán là sự thật của thế giới chúng ta.
Đã được gán cho một danh mục cụ thể – cầu vồng, mắt, ma cà rồng – bởi GAN, điểm này là trọng tâm của các hình ảnh mà chúng ta gặp phải trong loạt tác phẩm Adversarially Evolved Hallucinations, nơi các phân loại kỳ lạ, nếu không nói là kỳ quái, thường truyền đạt mức độ mà các mô hình xử lý hình ảnh AI phổ biến, nếu không muốn nói là luôn luôn, tham gia vào việc sản xuất, sử dụng cụm từ của Paglen, một hình thức hiện thực máy móc đáng ngờ. Việc tạo ra một tập huấn luyện đòi hỏi, ông quan sát, việc phân loại và sắp xếp hàng nghìn hình ảnh bởi các nhà điều hành con người. Sau đó, ông tiếp tục, có giả định rằng các danh mục đó, cùng với các hình ảnh chứa đựng trong chúng, tương ứng với những thứ ngoài thế giới thực.
Lựa chọn hình ảnh từ tập dữ liệu
Trong thực tế ảo của máy móc này, chúng ta tìm thấy một bản sao thay thế đáng lo ngại của thế giới, trong đó chúng ta phải đối mặt với thực tế rằng các mạng nơron và các mô hình học sâu tham gia vào việc huấn luyện máy móc để nhìn không chỉ dễ dàng mắc lỗi hệ thống, mà chúng còn dễ dàng rơi vào việc ảo giác về những đối tượng không tồn tại. Khi mà các hệ thống xử lý hình ảnh không trả lại những bản sao chính xác hoặc phân loại đúng đắn về thế giới, chúng thường xuyên tạo ra những thực tại ảo giác. Chính xu hướng này mà Paglen khuếch đại khi ông can thiệp vào các lĩnh vực tiềm ẩn của lý luận thuật toán – những lớp ẩn bên trong mạng nơron nơi AI đưa ra phân loại và kết nối. Chính tại đây, khi hình ảnh trở lại với chúng ta trong các biến thể kỳ lạ trên cùng một chủ đề, các thuật toán có thể được điều chỉnh và tinh chỉnh một cách kín đáo bởi một lập trình viên – hoặc, như trong trường hợp này, một lập trình viên kiêm nghệ sĩ như Paglen. Bằng cách tăng cường tiềm năng ảo giác trong GAN, các ứng dụng thông thường của thuật toán (như nhận diện hình ảnh) có thể được tách biệt phê phán khỏi chức năng tiện ích của chúng và được tiết lộ cho những gì chúng thực sự là: các phép tính xác suất thống kê và các ẩn dụ cơ học về thực tế.
Trong việc làm sáng tỏ cơn mê tính toán điều khiển AI tạo sinh, thực hành của Paglen khai thác, tận dụng và mâu thuẫn với các tuyên bố thường được thổi phồng liên quan đến tính hiệu quả của các mạng nơron trong các nhiệm vụ phân loại hình ảnh. Nếu Rainbow thực sự là một phép ẩn dụ kỳ lạ về cầu vồng, được triệu hồi bởi lý luận thuật toán, thì chúng ta hiểu như thế nào về các quy trình mà qua đó các mạng nơron tạo ra những hình ảnh ảo giác như vậy? Paglen hỏi, chúng ta suy nghĩ từ bên trong các hệ thống này như thế nào thay vì chỉ phản ánh về tầm quan trọng tiềm ẩn của chúng?
Ảnh hưởng tích lũy và ngày càng gia tăng của AI lên cuộc sống của chúng ta và cách chúng ta sống đưa ra một lập luận mạnh mẽ về việc phát triển các phương pháp nghiên cứu, chẳng hạn như những phương pháp mà Paglen triển khai, được thiết kế để khuyến khích một phạm vi suy nghĩ phê phán từ bên trong thiết bị của AI. Thông qua việc phát triển các phương pháp này, chúng ta có thể đảm bảo rằng quá trình huấn luyện hệ thống (liên quan đến việc gắn nhãn và nhập dữ liệu, chẳng hạn) và các không gian tính toán (tiềm ẩn và thuật toán) của hệ thống được hiểu rõ hơn về bản chất thực sự của chúng: các phép tính xác suất thống kê, chứ không phải sự chắc chắn, nhưng vẫn định hình các khía cạnh quan trọng trong cách chúng ta nhận thức và sống trong thế giới ngày nay.