Tổng quan về công nghệ Neural Network

Đây là cụm từ mà bạn rất thường hay thấy trong những thông tin liên quan đến trí tuệ nhân tạo. Về cơ bản, bạn có thể nghĩ về những thứ này như các lớp cấu thành trí tuệ nhân tạo.

Neural network, tạm gọi là mạng lưới thần kinh nhân tạo, sẽ nằm dưới cùng. Đây là hệ thống các máy tính và thiết bị hệ thống điện toán nói chung được kết nối theo một cách nào đó để mô phỏng lại một phần cách hoạt động của các nơ-ron thần kinh trong não người. Những chiếc máy tính trong neural network có thể nằm gần nhau trong cùng một phòng hay cách xa nhau cả nghìn cây số, mỗi một chiếc máy tính trong đó có thể được xem như một đơn vị thần kinh, gọi là node.

Neural network không nhất thiết phải dựa trên phần cứng, nó vẫn có thể là phần mềm và các giải thuật.

Khái niệm về neural network đã có từ những năm 1950 với sự ra đời của ngành nghiên cứu về trí tuệ nhân tạo. Người ta nói rằng khi nằm riêng biệt, những node máy tính này chỉ chạy những gì được lập trình sẵn và chỉ có thể trả lời những câu hỏi đơn giản, hay nói cách là nó “không thông minh”. Cũng giống như trong cơ thể người, một nơ-ron không chưa làm nên chuyện, nhưng khi kết nối chúng thành một mạng lưới dày đặt thì mọi chuyện sẽ khác đi rất nhiều. Khi các hệ thống máy tính được nối lại với nhau, chúng có thể giải quyết những vấn đề khó khăn hơn. Và quan trọng nhất, khi áp dụng đúng thuật toán, người ta có thể “dạy học” cho máy tính.

Về bản chất học chính là quá trình hiệu chỉnh trọng số liên kết giữa các nơron sao cho giá trị hàm lỗi là nhỏ nhất. Có ba phương pháp học phổ biến là học có giám sát, học không giám sát và học tăng cường. Học có giám sát là phương pháp được sử dụng phổ biến nhất, trong đó tiêu biểu là kỹ thuật lan truyền ngược.

Thông thường, một mạng nơ-ron bao gồm một hoặc nhiều nhóm các nơ-ron được kết nối vật lý với nhau hoặc có liên quan với nhau về chức năng. Một nơ-ron đơn có thể được nối với nhiều nơ-ron khác và tổng số nơ-ron và kết nối trong một mạng có thể là một giá trị cực kỳ lớn. Các kết nối, gọi là các khớp thần kinh (synapses), thường nối từ các axon tới các tế bào tua gai thần kinh (dendrite), tuy có thể có các vi mạch dendrodentritic và các kết nối khác. Ngoài tín hiệu điện, còn có các dạng tín hiệu khác phát sinh từ việc khuyếch tán các chất dẫn truyền xung động thần kinh (neurotransmitter). Chúng có ảnh hưởng đối với tín hiệu điện. Do vậy, cũng như các mạng sinh học khác, mạng nơ-ron vô cùng phức tạp.

Trong khi hiện nay, dù chưa đạt Mạng nơ-ron 1/7 được một mô tả chi tiết nào về hệ thần kinh , người ta vẫn ngày càng hiểu rõ hơn về các cơ chế cơ bản. Trí tuệ nhân tạo và Mô hình nhận thức (cognitive modelling) cố gắng giả lập một số tính chất của mạng nơ-ron. Tuy các kỹ thuật của hai ngành là tương tự, Trí tuệ nhân tạo có mục tiêu giải quyết các bài toán cụ thể, trong khi ngành kia hướng tới việc xây dựng các mô hình toán học của các hệ thần kinh sinh học.

Trong ngành Trí tuệ nhân tạo, mạng nơ-ron đã được áp dụng thành công trong các lĩnh vực nhận dạng tiếng nói, xử lý ảnh và điều khiển thích nghi, để xây dựng các agent phần mềm (software agent) (trong trò chơi điện tử và máy tính) hoặc robot tự hành. Hầu hết các mạng nơ-ron nhân tạo hiện được dùng cho trí tuệ nhân tạo đều dựa trên lý thuyết điều khiển, tối ưu hóa, và ước lượng thống kê. Ngành Mô hình nhận thức nghiên cứu mô hình toán học hoặc vật lý của hoạt động của hệ thần kinh; từ mức độ nơ-ron (ví dụ, mô hình cung phản xạ thần kinh tủy sống đối với kích thích), tới mức độ đám nơ-ron (ví dụ, mô hình sự giải phóng và tác dụng của dopamine trong các hạch thần kinh căn bản), rồi tới mức cơ thể sống hoàn chỉnh (ví dụ, mô hình hành vi phản xạ của cơ thể sống đối với kích thích).

Bộ não, mạng nơ-ron và máy tính

Trong lịch sử, bộ não đã từng được xem là một dạng máy tính, và ngược lại. Tuy nhiên, điều này chỉ đúng theo nghĩa rộng nhất. Máy tính không phải là mô hình của bộ não (mặc dù có thể mô tả một quá trình suy luận logic như là một chương trình máy tính, hoặc có thể kích thích não bằng một cái máy tính) do chúng đã không được chế tạo với mục đích này. Tuy nhiên, từ xưa, các mạng nơ-ron dùng trong trí tuệ nhân tạo đã được xem là các mô hình đơn giản của hoạt động thần kinh trong não. Một chủ đề của các nghiên cứu hiện nay trong ngành thần kinh học lý thuyết là câu hỏi: mạng nơ-ron cần phức tạp đến đâu và cần có những tính chất gì để có thể tái tạo cái gì đó giống như trí thông minh động vật.

Mạng nơ-ron và Trí tuệ nhân tạo

Nền tảng

Các mô hình mạng nơ-ron trong trí tuệ nhân tạo thường được gọi là các mạng nơ-ron nhân tạo; chúng thực chất là các mô hình toán học đơn giản định nghĩa một hàm f : X ->Y. Từ mạng được sử dụng vì hàm này phân rã được thành các thành phần đơn giản hơn kết nối với nhau.

Mạng nơ-ron

Một loại mô hình mạng nơ-ron cụ thể tương ứng với một lớp hàm như vậy. Khả năng học là điều thu hút nhiều quan tâm nhất tới mạng nơ-ron. Cho trước một bài toán cụ thể để giải quyết, và một lớp các hàm F, việc học có nghĩa là sử dụng một tập các quan sát để tìm hàm f^* \in F giải được bài toán một cách tốt nhất. Việc đó đòi hỏi định nghĩa một hàm chi phí C : F ->{R} sao cho, với lời giải tối ưu f * , Hàm chi phí C là một khái niệm quan trọng trong học máy, do nó là một phép đo khoảng cách tới lời giải tối ưu cho bài toán cần giải quyết. Các thuật toán học tìm kiếm trong không gian lời giải để được một hàm có chi phí nhỏ nhất có thể.

Các loại học

Có ba kiểu học chính, mỗi kiểu mẫu tương ứng với một nhiệm vụ học trừu tượng. Đó là học có giám sát, học không có giám sát và học tăng cường. Thông thường, loại kiến trúc mạng nào cũng có thể dùng được cho các nhiệm vụ trên.

Học có giám sát

Trong học có giám sát, ta được cho trước một tập ví dụ gồm các cặp và mục tiêu là tìm một hàm f (trong lớp các hàm được phép) khớp với các ví dụ. Nói cách khác, ta muốn tìm ánh xạ mà dữ liệu đầu vào đã hàm ý, với hàm chi phí đo độ không khớp giữa ánh xạ của ta và dữ liệu.

Học không có giám sát

Trong học không có giám sát, ta được cho trước một số dữ liệu x, và hàm chi phí cần được cực tiểu hóa có thể là một hàm bất kỳ của dữ liệu x và đầu ra của mạng, f. Hàm chi phí được quyết định bởi phát biểu của bài toán. Phần lớn ứng dụng nằm trong vùng các bài toán ước lượng như mô hình hóa thống kê, nén, lọc (filtering), blind source seperation và phân mảnh (clustering).

Học tăng cường

Trong học tăng cường, dữ liệu x thường không được cho trước mà được tạo ra trong quá trình một agent tương tác với môi trường. Tại mỗi thời điểm t, agent thực hiện hành động yt và môi trường tạo một quan sát xt và một chi phí tức thời ct, theo một quy trình Mạng nơ-ron động nào đó (thường là không được biết). Mục tiêu là tìm một sách lược lựa chọn hành động để cực tiểu hóa một chi phí dài hạn nào đó, nghĩa là chi phí tích lũy mong đợi. Quy trình động của môi trường và chi phí dài hạn cho mỗi sách lược thường không được biết, nhưng có thể ước lượng được. Mạng nơ-ron nhân tạo thường được dùng trong học tăng cường như là một phần của thuật toán toàn cục. Các bài toán thường được giải quyết bằng học tăng cường là các bài toán điều khiển, trò chơi, và các nhiệm vụ quyết định tuần tự (sequential decision making) khác.

Công nghệ