Ứng dụng thực tiễn của Machine Learning – Nhận diện và dự đoán

Machine Learning

Machine Learning, thuật toán kiến tạo quá trình tự học của máy tính, là một trong những công nghệ tin học hàng đầu hiện nay trong mảng nhận diện, dự đoán và tự động hóa. Các thuật toán của Machine Learning sau khi luyện tập trên hàng nghìn dữ liệu cho trước sẽ có khả năng dự đoán các số liệu, dự đoán xu hướng, và dự đoán nước chơi; hoặc nhận diện nhận diện hình ảnh và nhận diện âm thanh.

Dưới đây là giới thiệu về một số thuật toán Machine Learning hiện đại và phổ biến nhất hiện nay. Deep learning: “Học sâu”Thuật toán này sử dụng neural network, cấu trúc được lấy “cảm hứng” từ mạng lưới thần kinh của con người, một trong những cấu trúc sống với khả năng học hỏi cao nhất. Giống như mạng lưới thần kinh trong não bộ, Neural Network bao gồm nhiều lớp “neurons” liên kết với nhau thành một mạng lưới. Hai thuật toán Deep Learning có tính ứng dụng cao nhất là Recurrent Neural Network và Convolutional Neural Network

Neural Network

Recurrent Neural Network: là một dạng Neural Network tái diễn, được sử dụng để dự đoán các dữ liệu dạng chuỗi, ví dụ như dự đoán từ tiếp theo trong một câu, hoặc dự đoán thời tiết của ngày hôm sau.

Recurrent Neural Network cơ bản bao gồm một đơn vị neuron đặc biệt, có “trí nhớ” (trong ảnh gọi là neuron “A”). Dữ liệu luyện tập được lần lượt đưa vào neuron này, và quá trình này được lặp lại.. Sau mỗi lần luyện tập, Recurrent Neural Network học được thêm một chút và sử dụng kinh nghiệm này cho lần học tiếp theo.

Convolutional Neural Network: là một dạng Neural Network trong đó các lớp neuron đầu tiên có chức năng tìm tập hợp các điểm đặc trưng (feature) của hình ảnh, và sử dụng các đặc điểm (feature) này để các lớp neuron phía sau đưa ra dự đoán. Trong quá trình luyện tập, Convolutional Neural Network sẽ cố gắng tìm ra tập hợp các feature tốt nhất để đưa ra dự đoán tối ưu.

Convolutional Neural Network trên được dùng để nhận diện chữ số. Đầu tiên, hình ảnh số 8 sẽ được đưa vào network. Tại lớp đầu tiên, network chọn ra 6 feature của khác nhau của một hình ảnh. Tại lớp thứ 2, các feature này được thu nhỏ. Sau đó, mỗi feature được cắt thành nhiều mảnh ở lớp thứ 3. Tại lớp thứ 4, các mảnh này lại được thu nhỏ. Ở các lớp còn lại, các pixels trong ảnh được ghép lại thành một dãy dữ liệu để đưa vào lớp neuron dự đoán.

Reinforcement Learning: Thuật toán này lấy cảm hứng từ quá trình học hỏi theo cơ chế thưởng phạt ở con người. Reinforcement learning học và tích lũy kinh nghiệm để đưa ra hành động (action) sao cho với trạng thái môi trường hiện tại (state), hành động sẽ tối đa hóa phần thưởng (reward) nhận được.

Hệ thống action-state-reward.

Deep Reinforcement Learning: “Học sâu và tăng cường”. Đây là một kết hợp mạnh mẽ giữa Deep Learning và Reinforcement Learning, trong đó Neural Network tham gia vào quá trình quyết định hành động của Reinforcement Learning, từ đó dẫn đến một quá trình học tối ưu hơn!

Hệ thống action-state-reward, trong đó, Neural Network là bộ phận quyết định action.

Sử dụng các thuật toán nói trên, Machine Learning đem đến các ứng dụng vô cùng tân tiến và hữu ích. Dưới đây là một trong số các ứng dụng thú vị nhất:

1. Tô màu cho tranh trắng đen Thông thường, cần có một một chuyên gia chỉnh ảnh để tô màu cho các bức ảnh trắng đen và công việc này tốn rất nhiều công sức và thời gian. Tuy nhiên, hiện nay, sử dụng một Convolutional Network lớn để học màu sắc, thuật toán của Machine Learning có khả năng tô màu cho các ảnh trắng đen như cách một chuyên gia sẽ làm. Kết qua thật đáng kinh ngạc!

Hình ảnh được tô màu bởi Convolutional Neural Network.

2. Lồng tiếng cho phim câm Ứng dụng này sử dụng cả Convolutional Neural Network và Recurrent Neural Network, trong đó Convolutional Neural Network được dùng để nhận dạng cảnh phim, sau đó Recurrent Neural Network được sử dụng để tạo ra chuỗi âm thanh (tiếng trống) phù hợp với cảnh phim vừa được nhận diện. Khi một chiếc máy tính sử dụng cả hai thuật toán trên và một chuyên gia con người cùng lồng tiếng cho một cảnh phim, không ai có thể phân biệt được âm thanh được tạo ra là do máy hay do người (bài kiểm tra này gọi là Turing test, bài kiểm tra độ thông minh của trí tuệ nhân tạo).

Demo: Visually indicated sounds – Captions for silent movie

3. Máy phiên dịchSử dụng Recurrent Neural Network, Machine Learning có khả năng phiên dịch giữa hai thứ tiếng. Hơn nữa, thuật toán không chỉ có khả năng phiên dịch các câu cú được nhập vào mà còn có khả năng phiên dịch hình ảnh nhờ sử dụng Convolution Neural Network để nhận diện các từ xuất hiện trong ảnh (hình minh họa).

Logo trên hộp bánh quy được phiên dịch từ tiếng Đức sang tiếng Anh nhờ Recurrent và Convolutional Neural Network.

Demo:

4. Nhận diện đồ vật trong ảnhSử dụng một Convolutional Neural Network lớn, các nhà nghiên cứu, trong đó tiên phong là nhà nghiên cứu Alex Krizhevsky, đã thành công trong việc tạo ra thuật toán có khả năng tìm thấy và nhận biết các đồ vật riêng biệt có trong ảnh.

Trong hình, thuật toán có khả năng nhận diện hai vật riêng biệt trong ảnh. Thuật toán nhận diện vật thứ nhất là một chú chó và vật thứ hai là một chiếc mũ rộng vành.

Demo: Neural Network Image Classification

5. Nhận diện chữ viết taySử dụng Recurrent Neural Network, thuật toán có khả năng học cách viết chữ từ nét chữ của người. Sau đó, thuật toán có thể viết ra bất kỳ dòng chữ nào theo yêu cầu sử dụng nét viết tương tự.

Đây là chữ viết được tạo ra bởi Convolutional Neural Network. Thuật toán này học từ ba loại chữ viết tay khác nhau.

Demo: Neural Network Handwriting Generator

6. Viết truyện – làm thơ – viết quảng cáo…

Tháng 12 năm 2017, fan hâm mộ Harry Porter không khỏi ngạc nhiên trước thông tin Harry Porter có chương mới, nhưng niềm vui đó không trọn vẹn vì sản phẩm không phải do nhà văn phù thủy JK Rowling chấp bút mà được xây dựng bằng trí tuệ nhân tạo (AI – Artificial Intelligence). Bằng cách sử dụng tính năng tiên đoán, Botnik Studios đã cho AI đọc toàn bộ 7 phần Harry Potter rồi sau đó AI sẽ tự động phân tích từ ngữ, câu văn và ngữ pháp để soạn ra những đoạn văn hoàn toàn ngẫu nhiên mà khi đọc lên, người đọc vẫn nhận ra có gì đó “giống giống” phong cách của nữ văn sỹ J.K.Rowling. Tuy còn nhiều sai sót về cốt truyện và cấu trúc hành văn chưa được ổn lắm, nhưng cấu trúc ngữ pháp hầu như rất chính xác – đây được coi là bước tiến lớn và nhiều tiềm năng đối với công nghệ AI trong lĩnh vực sáng tác.

Thật vậy, đến tháng 04 năm 2018, Bonik đã dùng AI xây dựng nên câu chuyện mang tên “Nàng công chúa và con cáo” mang đầy đủ các yếu tố đặc trưng của cổ tích như: một nàng công chúa xinh đẹp bị vua cha ép làm đám cưới, chàng trai nghèo con của người thợ xay bột, con thú biết nói, cùng vương quốc chỉ toàn “bánh mì và phô mai”. Họ đã sử dụng một chương trình AI để “học” những câu chuyện cổ tích của anh em nhà Grimm, rồi đưa ra gợi ý cho các từ và cụm từ theo luồng mạch tương tự. Sau đó, ê-kíp biên tập của Botnik thêm vào các chi tiết, sắp xếp các ý tưởng có được từ thuật toán AI thành một câu chuyện hoàn chỉnh. CALM, ứng dụng thư giãn tâm trí đã đặt mua sản phẩm này và đưa vào tuyển tập những câu chuyện của ứng dụng với cái tên “Chuyện cổ Grimm bị thất lạc”. Hãy cùng tham khảo một đoạn ngắn trong truyện AI này bạn nhé:

Còn làm thơ thì sao? Vừa qua, nhóm kỹ sư của Brooklyn đã sử dụng AI để kết hợp trái tim của đại thi hào Shakespeare với khả năng của AI để tạo ra ứng dụng cho phép người dùng nhanh chóng có được những bài thơ gửi người thương mang phong cách của Shakespeare. Nhóm đã sử dụng dữ liệu từ 154 bài thơ của Shakespeare áp dụng vào xích Markov, mô hình xử lý ngôn ngữ tự nhiên và thuật toán để đoán xem từ nào sẽ xuất hiện kế tiếp để tạo nên những bài thơ đọc lên nghe “có vẻ” Shakespeare. Bạn có thể thử xem kết quả thế nào tại đây

Không dừng lại đó, tháng 07/2018 cổng thương mại điện tử Alibaba của Trung Quốc đã tạo ra một công cụ Trí tuệ nhân tạo (AI), cho phép có thể phát sinh ra 20.000 mẫu quảng cáo mỗi giây. Người bán có thể lựa chọn các ý tưởng quảng cáo khác nhau để tạo ra quảng cáo của riêng mình thông qua công cụ cho phép “tạo ra quảng cáo thông minh theo mẫu” và như vậy họ không phải mất nhiều thời gian cho việc viết lách. Christina Lu, phụ trách bộ phận tiếp thị của Alibaba, cho biết: “Những nội dung được AI viết ra là kết quả của quá trình deep learning dựa vào khối lượng lớn những nội dung chất lượng cao do con người tạo ra trước đó. AI sẽ không thể thay thế hoàn toàn con người trong công việc vốn đòi hỏi nhiều sự sáng tạo này. Nhưng khi áp dụng trí tuệ nhân tạo cho Marketing, con người sẽ có thể dành nhiều thời gian, công sức và trí tuệ hơn cho việc sáng tạo“. Rất rất nhiều ứng dụng của trí tuệ nhân tạo đang dần bước vào cuộc sống chúng ta, để kết thúc phần này chúng tôi gửi đến bạn ứng dụng AutoDraw của Google, trợ thủ đắc lực trong việc giúp bạn vẽ minh họa.

AutoDraw sử dụng trí thông minh nhân tạo (AI) để phân tích các nét vẽ nguệch ngoạc của bạn và biến chúng thành những sản phẩm hoàn chỉnh trong nháy mắt. Với khả năng có thể đoán được ý nghĩ của bạn và AI sẽ biến thành những hình ảnh giống với những gì bạn nghĩ. Đó là một bước tiến của AI và là kết quả từ các tính toán tốc độ cao trên kho dữ liệu học khổng lồ của Google.

Demo: Sunspring | A Sci-Fi Short Film Starring Thomas Middleditch

7. Chơi gameSử dụng Reinforcement Learning hoặc Deep Reinforcement Learning, thuật toán có khả năng chơi game tự động sử dụng chiến thuật vô cùng phức tạp. Trí tuệ nhân tạo chơi game là một trong những chủ đề nóng gần đây, với những ván đấu kịch tính diễn ra giữa trí tuệ nhân tạo và các người chơi chuyên nghiệp trong các trò chơi kinh điển và trò chơi trực tuyến. Vào tháng 10 năm 2015, AlphaGo – trí tuệ nhân tạo thiết kế bởi Google đã chiến thắng nhà vô địch thế giới Lee Sedol trong trò chơi Go, và trở thành một trong trong những thành công vang dội nhất trong lịch sử trí tuệ nhân tạo.

AlphaGo vs. Lee Sedol.

Demo: Pong game: Human vs. AI

(Nguồn Google Developer)

Hits: 342