Tóm tắt văn bản trong Machine Learning

1. Giới thiệu Tóm tắt văn bản là một bài toán con trong lĩnh vực Xử Lý Ngôn Ngữ Tự Nhiên (Natural Language Processing) để tạo ra một văn bản […]

Ứng dụng Pipeline nâng cao

Như đã phân tích ở các bài trước, để xây dựng một mô hình học máy có tính hiệu quả trong thực tế chúng ta cần có một luồng xử […]

Bag of Words (Bow) TF-IDF

Bag of Words là một thuật toán hỗ trợ xử lý ngôn ngữ tự nhiên và mục đích của BoW là phân loại text hay văn bản. Ý tưởng của […]

Sử dụng Pipeline trong sklearn

Khi chuẩn bị data cho model trong machine learning, các điểm dữ liệu đôi khi chênh lệch nhau quá lớn, một thành phần có khoảng giá trị từ 0 đến […]

Tổng quan về Word Embedding

1. Khái niệm Word Embedding là tên gọi chung của các mô hình ngôn ngữ và các phương pháp học theo đặc trưng trong Xử lý ngôn ngữ tự nhiên(NLP), ở […]

Mạng ngữ nghĩa WordNet

Các mối quan hệ trên ý nghĩa của từ Từ vốn được hình thành để chỉ các khái nhiệm. VD: Từ “mèo” dùng để chỉ một loài vật có bốn […]