BỘ SƯU TẬP TÀI NGUYÊN SỐ THƯ VIỆN TRƯỜNG ĐẠI HỌC FPT

Trang chủ Quay lại

Key Information Extraction from Vietnamese Invoices by Combining Layout and Context

Show simple item record

dc.contributor.advisor Lê, Đình Huynh
dc.contributor.author Ngô, Tuấn Anh
dc.contributor.author Trần, Mạnh Cường
dc.date.accessioned 2021-07-01T02:41:19Z
dc.date.available 2021-07-01T02:41:19Z
dc.date.issued 2021
dc.identifier.uri /handle/123456789/3022
dc.description Thesis: 54 pages en_US
dc.description.abstract This thesis introduces a deep approach, an effective and robust framework in handling complex document layout, visual features, and textual semantics for Key Information Extraction (KIE). The algorithm combines graph learning with graph convolution, resulting in a richer semantic representation that includes both textual and visual features and a clear global layout. The model's input only with the coordinates of token bounding boxes, avoiding the use of raw images. It leads to a layout-aware language model, which can fine-tune downstream tasks. The model is evaluated on a key information extraction task using publicly available datasets SROIE. We show that it achieves superior performance on datasets consisting of visually rich documents while outperforming the baseline RoBERTa on documents. en_US
dc.language.iso en en_US
dc.publisher FPTU Hà Nội en_US
dc.subject Computer Science en_US
dc.subject Key information extraction en_US
dc.subject Natural Language Processing en_US
dc.subject Layout analysis en_US
dc.title Key Information Extraction from Vietnamese Invoices by Combining Layout and Context en_US
dc.type Working Paper en_US


Các tập tin trong tài liệu này

Tài liệu này xuất hiện trong Bộ sưu tập

Show simple item record


 

Bộ sưu tập thuộc về Trung tâm Thông tin - Thư viện - Trường Đại học FPT
Địa chỉ: Phòng 207 - Tầng 1 - Km 28 - Khu công nghệ cao Hòa Lạc - Thạch Hòa - Thạch Thất - Hà Nội
Điện thoại: 844.66805912 - FAX: - Email: thuvien_fu_hoalac@fpt.edu.vn