Bài đăng

ECM Solution

1. Mục tiêu - Có thể cung cấp cho nhiều mô hình doanh nghiệp khách nhau - Có tầm nhìn như một enterprise model: hỗ trợ(đọc, hiểu, làm sạch, ký số) được phần lớn các định dạng văn bản office. Hỗ trợ truy xuất, lưu trữ , duy trì, phân loại và bảo quản văn bản. - Các framework(FileNet hay Sharepoint) khác nhau có thể được sử dụng để thay thế. - Quản lý tiến trình nghiệp vụ: + các quy trình xử lý được quản lý và được thừa kế giữa các đại lý + tái cấu trúc quy trình nghiệp vụ quản lý văn bản của chính phủ là cơ sở triển khai ECM 2. Định nghĩa Là hệ thống quản lý nội dung gồm các phân hệ: - Quản lý văn bản và quản lí hồ sơ: media(images, audio, video), papers, books, text, report, maps - Quản lý nội dung web: website, html, xml/json form including e-forms - Quản lý email/message: email NOTE: - Định nghĩa khái niệm "hồ sơ công khai" - Định nghĩa khái niệm "quản lý hồ sơ" Chức năng cần có 1. Imaging: scanning. OCR số hóa văn bản hoặc hỗ trợ truy xuất văn bản t

SQL vs NOSQL vs NEWSQL

Với SQL hiện đang xâm chiếm trại NoQuery, (xem  tại đây  ), tổ chức nên chọn như thế nào giữa cơ sở dữ liệu SQL truyền thống, kho lưu trữ dữ liệu NoQuery hoặc cơ sở dữ liệu NewQuery?  Người chiến thắng giải thưởng Turing 2015, Mike Stonebraker đã nói điều đó tốt nhất: một kích cỡ không phù hợp với tất cả các loại.  Ý tưởng rằng một sản phẩm cơ sở dữ liệu có thể đáp ứng bất kỳ (hoặc tất cả) trường hợp sử dụng đơn giản là không đúng trong những ngày này. Cơ sở dữ liệu #NoQuery so với #Query: 'Một kích thước không phù hợp với tất cả.' Nếu bạn hài lòng với hiệu suất, khả năng mở rộng và tính sẵn sàng cao của hệ thống cơ sở dữ liệu SQL truyền thống hiện tại của bạn (như Oracle, SQL Server, MySQL), thì không có lý do gì để đọc thêm.  Tuy nhiên, nếu bạn có những cơn đau ngày càng tăng ở bất kỳ khu vực nào trong số này, thì việc cung cấp NoQuery hoặc NewQuery có thể phù hợp với bạn.  Vậy làm thế nào để bạn chọn giữa chúng? Chọn công cụ phù hợp cho công việc trong tay là 8

Sharding, Snowflake Instagram trong bài toán đối soát dữ liệu

Có 3 vấn đề về chất lượng dữ liệu của hệ thống: - Dữ liệu không đồng nhất giữa các phiên bản được lưu trữ tại các kho khác nhau - Dữ liệu bị trùng lặp - Dữ liệu bị sai bản chất ngữ nghĩa. Việc sai này có thể do định nghĩa sai, hoặc do nghiệp vụ thay đổi. Xem thêm tại  Quản lí chất lượng dữ liệu Việc đối soát dữ liệu trong hệ thống có sự trao đổi thông tin(trao đổi nội bộ giữa các phân hệ hoặc giữa ứng dụng với ứng dụng khác) là nghiệp vụ thường xuyên nhằm duy trì chất lượng dữ liệu. Trong bài này, tôi chỉ tập trung vào việc đối soát dữ liệu giữa các phiên bản được lưu trữ tại các kho khác nhau. Kho trong trường hợp này, tôi xem xét là 1 cơ sở dữ liệu quan hệ(oracle, mysql, sql server). Nguyên lý quản lý đối soát dữ liệu: 1.RÀNG BUỘC - Nguyên tắc: chỉ đối soát sự tồn tại với phiên bản dữ liệu (data version), không đối soát chi tiết thuộc tính của thực thể(item) - Lý do: Tất cả các nghiệp vụ trao đổi thông tin đã được xử lý theo giao dịch 2. VẤN ĐỀ MỤC TIÊU - Đối soát với