“`html
Các mô hình trí tuệ nhân tạo có thể phát hiện suy nghĩ tự tử trên mạng xã hội không?
Mỗi năm, hơn 720.000 người tử vong do tự tử trên toàn thế giới, khiến đây trở thành một trong những nguyên nhân hàng đầu gây tử vong ở người trẻ tuổi. Các mạng xã hội, như Reddit, đã trở thành những không gian nơi cá nhân công khai bày tỏ nỗi đau tâm lý của mình, đôi khi theo cách gián tiếp hoặc ẩn dụ. Một nghiên cứu gần đây đã đánh giá khả năng của các công cụ tin học khác nhau trong việc nhận diện những tín hiệu đau khổ này trong các bài đăng trực tuyến.
Các nhà nghiên cứu đã so sánh nhiều phương pháp: các mô hình học máy cổ điển, mạng nơ-ron sâu và một mô hình ngôn ngữ tiên tiến dựa trên trí tuệ nhân tạo. Các phương pháp truyền thống, như máy vector hỗ trợ (SVM) hoặc rừng ngẫu nhiên, đã được thử nghiệm với các biểu diễn ngữ nghĩa của văn bản. Các mạng nơ-ron, chẳng hạn như CNN và LSTM, cũng được đánh giá về khả năng nắm bắt các mẫu ngữ cảnh và cảm xúc. Cuối cùng, một mô hình kiểu GPT-2, được điều chỉnh đặc biệt, đã được huấn luyện để phân loại tin nhắn thành hai loại: có nguy cơ tự tử hoặc không có nguy cơ tự tử.
Kết quả cho thấy mô hình GPT-2 đạt hiệu suất tốt nhất, với độ chính xác 98,25%. Nó đã phân biệt hiệu quả giữa các tin nhắn có nguy cơ và những tin nhắn không có nguy cơ, đồng thời giảm thiểu sai sót trong phân loại. Trong số các mạng nơ-ron, CNN đạt độ chính xác 96,04%, theo sau là LSTM với 95,97%. Các mô hình cổ điển, khi được kết hợp với các biểu diễn ngữ nghĩa như bộ mã hóa câu phổ quát, cũng cho thấy hiệu quả tốt, với độ chính xác vượt quá 93% đối với các tổ hợp tốt nhất.
Nghiên cứu nhấn mạnh rằng các mô hình dựa trên transformer, như GPT-2, xuất sắc trong việc nắm bắt các sắc thái cảm xúc và sự phụ thuộc ngữ cảnh dài. Những khả năng này đặc biệt hữu ích trong việc phát hiện các biểu hiện gián tiếp của nỗi đau khổ, thường xuất hiện trong các bài đăng trên mạng xã hội. Các mô hình truyền thống, mặc dù kém hiệu quả hơn, vẫn có tính cạnh tranh và dễ tiếp cận hơn về mặt tài nguyên tính toán.
Các nhà nghiên cứu cũng đã kiểm tra độ bền của kết quả bằng cách lặp lại các thí nghiệm với các cấu hình và phân vùng dữ liệu khác nhau. Hiệu suất của các mô hình, đặc biệt là GPT-2 và CNN, đã chứng tỏ sự ổn định và có thể tái tạo, khẳng định độ tin cậy của chúng trong bối cảnh này.
Nghiên cứu này làm nổi bật tầm quan trọng của các công cụ trí tuệ nhân tạo trong việc phát hiện sớm các tín hiệu đau khổ trên mạng xã hội. Tuy nhiên, các kết quả vẫn còn đặc thù cho nền tảng Reddit và bộ dữ liệu được sử dụng. Cần có thêm sự xác nhận trên các mạng xã hội khác và trong các ngôn ngữ khác nhau để có thể khái quát hóa những kết luận này.
“`
Sources du média
Document de référence
DOI : https://doi.org/10.1186/s43093-026-00867-w
Titre : A unified comparative evaluation of machine learning, deep learning and GPT-2 for suicide ideation detection from social media
Revue : Future Business Journal
Éditeur : Springer Science and Business Media LLC
Auteurs : Yasmeen Mohamed Saleh; Fahad Kamal Alsheref; Mahmoud Mohamed Bahloul