PaperStream — Bộ phần mềm số hóa tài liệu đi kèm máy scan Ricoh fi Series và SP Series
PaperStream là bộ phần mềm độc quyền của Ricoh đi kèm dòng máy scan fi Series và SP Series, gồm hai thành phần chính: PaperStream IP (driver xử lý ảnh) và PaperStream Capture (phần mềm quản lý quy trình số hóa). Bài viết giải thích từng tính năng và cách hai thành phần này phối hợp để tự động hóa công việc số hóa tài liệu trong môi trường văn phòng và tổ chức.
PaperStream là gì?
Ricoh trang bị bộ phần mềm PaperStream cho toàn bộ dòng máy scan fi Series và SP Series — từ nhóm workgroup nhỏ đến dòng production xử lý hàng chục nghìn trang mỗi ngày. Đây không phải phần mềm đơn lẻ mà là một hệ sinh thái gồm nhiều thành phần, mỗi thành phần đảm nhiệm một giai đoạn trong quy trình số hóa.
Hai thành phần cốt lõi mà người dùng cần hiểu là PaperStream IP (driver xử lý ảnh) và PaperStream Capture (phần mềm quản lý quy trình). Hai thứ này hoạt động cùng nhau: PaperStream IP lo đầu vào — chất lượng ảnh quét; PaperStream Capture lo đầu ra — phân loại, đánh chỉ mục và đưa file về đúng chỗ.

PaperStream IP — Driver xử lý ảnh
PaperStream IP là driver cài đặt trên máy tính, kết nối máy scan với hệ thống và xử lý ảnh ngay tại bước quét. Điểm khác biệt so với driver thông thường là phần mềm này can thiệp vào chất lượng ảnh chủ động, thay vì chỉ chuyển dữ liệu thô từ máy scan sang máy tính.
Xử lý ảnh tự động
iDTC (Intelligent DTC): Công nghệ độc quyền của Ricoh, tách biệt và làm nổi bật ký tự đen trên nền tài liệu. Kết quả là ảnh quét rõ hơn và OCR chính xác hơn, đặc biệt với tài liệu có nền phức tạp, nền màu hoặc nền có hoa văn.
Advanced Cleanup Technology: Tự động loại bỏ vết bẩn, nhiễu ảnh, dấu mộc đỏ và watermark khỏi ảnh quét. Không cần chỉnh từng trang thủ công sau khi quét.
Tự động xoay và chỉnh nghiêng: Phát hiện chiều tài liệu và chỉnh về đúng hướng. Với tài liệu có định dạng cố định, có thể đăng ký trước cấu hình xoay riêng để máy áp dụng nhất quán.
Xóa trang trắng tự động: Phát hiện và loại bỏ trang trắng trong lô quét, giảm khối lượng file đầu ra không cần thiết.
Tự động chọn profile: Khi đã đăng ký trước các định dạng tài liệu thường dùng, PaperStream IP nhận diện tài liệu đang quét và áp dụng cấu hình phù hợp mà không cần người dùng chọn tay.
OCR Optimization Assistant
Đây là công cụ hỗ trợ riêng để tinh chỉnh cấu hình quét nhằm đạt độ chính xác OCR cao nhất với từng loại tài liệu. Người dùng chỉ cần cung cấp mẫu tài liệu, công cụ phân tích và gợi ý điều chỉnh cụ thể — hữu ích với tài liệu có nền halftone, chữ mờ hoặc tài liệu cũ.
Tương thích rộng
PaperStream IP hỗ trợ cả chuẩn TWAIN và ISIS, cho phép kết nối với hầu hết phần mềm quản lý tài liệu của bên thứ ba mà tổ chức đang sử dụng. Không cần thay đổi ứng dụng hiện có.
PaperStream Capture — Phần mềm quản lý quy trình số hóa
PaperStream Capture xử lý phần còn lại sau khi ảnh đã được quét: tổ chức lô quét, phân loại tài liệu, kiểm tra chất lượng và đưa file về đích lưu trữ. Phần mềm này đi kèm miễn phí với tất cả máy scan fi Series và SP Series.
Thiết lập công việc quét (Job)
PaperStream Capture tổ chức công việc theo đơn vị "job" — mỗi job lưu sẵn toàn bộ cấu hình cho một loại tài liệu hoặc một quy trình cụ thể. Khi cần quét, người dùng chỉ chọn job và bấm nút, không phải cấu hình lại từ đầu.
Phần mềm cung cấp hai chế độ tạo job:
- Easy Setup: Ba lựa chọn đơn giản — lưu tài liệu, sắp xếp tài liệu, hoặc trích xuất dữ liệu. Phù hợp với người dùng không có nền kỹ thuật.
- Advanced Setup: Cho phép kết hợp nhiều mục đích trong một job, dành cho người dùng muốn tùy chỉnh sâu.
Tính năng Setting Assistant theo dõi thao tác thường xuyên của người dùng và đề xuất cài đặt phù hợp — ví dụ tự động đề nghị bật xóa trang trắng nếu phát hiện người dùng hay xóa thủ công.
Phân tách và phân loại tài liệu tự động
Thay vì phải tách file thủ công sau khi quét cả lô hỗn hợp, PaperStream Capture nhận diện ranh giới giữa các tài liệu và tách thành file riêng biệt ngay trong quá trình quét. Các phương thức tách hỗ trợ:
- Barcode 1D và 2D
- Patch code
- Trang trắng (một mặt hoặc hai mặt)
- Zonal OCR (đọc nội dung trong vùng xác định để nhận diện loại tài liệu)
- Số trang cố định
- Nhận diện form theo layout
Trích xuất dữ liệu và đánh chỉ mục
PaperStream Capture trích xuất thông tin từ tài liệu thông qua Zonal OCR, nhận diện barcode và nhận diện dấu tích. Dữ liệu trích xuất được dùng để:
- Đặt tên file và thư mục tự động
- Xuất ra file CSV làm chỉ mục cho hệ thống lưu trữ
- Thêm keyword vào PDF để hỗ trợ tìm kiếm toàn văn
Kiểm tra chất lượng ảnh (Image Check)
Sau khi quét, hệ thống hiển thị thumbnail có mã màu để người dùng nhận biết ngay vấn đề:
- Đỏ: Trang bị kẹp hai tờ (multi-feed)
- Đen: Trang trắng
- Vàng: Lỗi chất lượng ảnh phát hiện bởi AIQC
Assisted Scan: Với trang bị lỗi, thay vì đưa tài liệu vào quét lại, người dùng xem các phương án xử lý ảnh tự động mà phần mềm đề xuất và chọn kết quả tốt nhất. Nhanh hơn và ít ảnh hưởng đến tài liệu gốc hơn.
Đích lưu trữ hỗ trợ
PaperStream Capture kết nối trực tiếp đến các đích lưu phổ biến: thư mục cục bộ, thư mục mạng, SharePoint, SharePoint Online, FTP, SFTP, email và máy in. Với tùy chọn tích hợp bổ sung, có thể kết nối thêm Microsoft OneDrive, Dropbox, Google Drive và gửi qua SMTP.
Định dạng file đầu ra
Bitmap, TIFF, Multi-TIFF, JPEG, JPEG2000, PDF, Searchable PDF, PDF/A (PDF/A-1, PDF/A-2, PDF/A-3), PNG, RTF, Word, Excel, PowerPoint.
PaperStream Capture Pro — Phiên bản trả phí cho nhu cầu nâng cao
PaperStream Capture Pro là phiên bản mở rộng với license theo năm, dành cho tổ chức có khối lượng tài liệu lớn hoặc yêu cầu nghiệp vụ phức tạp hơn.
Nhận dạng chữ viết tay (Handprint OCR): Trích xuất dữ liệu từ phần điền tay trên biểu mẫu — hồ sơ, phiếu khảo sát, đơn đăng ký. Hỗ trợ tiếng Anh, Pháp, Tây Ban Nha, Đức, Ý và Nhật.
Ẩn thông tin nhạy cảm (Redaction): Xác định trước các vùng chứa thông tin cá nhân trên biểu mẫu. Khi quét, những vùng đó được che tự động trong file đầu ra mà không cần dán giấy hoặc chỉnh thủ công trước khi đưa tài liệu vào máy.
Multi-Station: Phân chia công việc cho nhiều máy tính: một trạm quét, một trạm kiểm tra ảnh, một trạm đánh chỉ mục — xử lý song song thay vì tuần tự. Quản lý theo dõi tiến độ và phân công lại qua Batch Manager.
After Scan Correction (ASC): Chỉnh sửa và cải thiện chất lượng ảnh sau khi đã quét xong, mà không cần tài liệu gốc. Đặc biệt hữu ích khi xử lý tài liệu cũ hoặc dễ hư hỏng.
PaperStream Capture Pro Premium: Bổ sung thêm khả năng nhập ảnh từ nguồn ngoài (file ảnh, PDF có sẵn, dữ liệu từ máy scan khác hãng) vào quy trình xử lý của PaperStream, và hỗ trợ dòng máy production fi-7600 trở lên.
Ngôn ngữ OCR hỗ trợ
PaperStream Capture hỗ trợ OCR cho ký tự in của hơn 20 ngôn ngữ, bao gồm tiếng Việt, tiếng Anh, tiếng Trung (giản thể và phồn thể), tiếng Nhật, tiếng Hàn, tiếng Ả Rập, tiếng Thái và các ngôn ngữ châu Âu phổ biến. Đây là điểm quan trọng với cơ quan nhà nước Việt Nam khi số hóa tài liệu song ngữ hoặc tài liệu có chữ nước ngoài.
PaperStream phù hợp với ai?
PaperStream là lựa chọn phù hợp khi tổ chức cần:
- Số hóa tài liệu khối lượng lớn hàng ngày với yêu cầu chất lượng nhất quán
- Tự động phân loại và đánh chỉ mục thay vì làm thủ công
- Tích hợp quy trình quét vào hệ thống lưu trữ hoặc phần mềm quản lý văn bản hiện có
- Đáp ứng yêu cầu về định dạng PDF/A và Searchable PDF theo Thông tư 05/2025/TT-BNV
Dòng máy scan Ricoh fi Series và SP Series phân phối bởi HPT Tech đều đi kèm PaperStream IP và PaperStream Capture. Liên hệ HPT Tech để được tư vấn model phù hợp với khối lượng và loại tài liệu của đơn vị.
