Bài đăng

Đang hiển thị bài đăng từ Tháng 7, 2020

SQL vs NOSQL vs NEWSQL

Với SQL hiện đang xâm chiếm trại NoQuery, (xem  tại đây  ), tổ chức nên chọn như thế nào giữa cơ sở dữ liệu SQL truyền thống, kho lưu trữ dữ liệu NoQuery hoặc cơ sở dữ liệu NewQuery?  Người chiến thắng giải thưởng Turing 2015, Mike Stonebraker đã nói điều đó tốt nhất: một kích cỡ không phù hợp với tất cả các loại.  Ý tưởng rằng một sản phẩm cơ sở dữ liệu có thể đáp ứng bất kỳ (hoặc tất cả) trường hợp sử dụng đơn giản là không đúng trong những ngày này. Cơ sở dữ liệu #NoQuery so với #Query: 'Một kích thước không phù hợp với tất cả.' Nếu bạn hài lòng với hiệu suất, khả năng mở rộng và tính sẵn sàng cao của hệ thống cơ sở dữ liệu SQL truyền thống hiện tại của bạn (như Oracle, SQL Server, MySQL), thì không có lý do gì để đọc thêm.  Tuy nhiên, nếu bạn có những cơn đau ngày càng tăng ở bất kỳ khu vực nào trong số này, thì việc cung cấp NoQuery hoặc NewQuery có thể phù hợp với bạn.  Vậy làm thế nào để bạn chọn giữa chúng? Chọn công cụ phù hợp cho công việc trong tay là 8

Sharding, Snowflake Instagram trong bài toán đối soát dữ liệu

Có 3 vấn đề về chất lượng dữ liệu của hệ thống: - Dữ liệu không đồng nhất giữa các phiên bản được lưu trữ tại các kho khác nhau - Dữ liệu bị trùng lặp - Dữ liệu bị sai bản chất ngữ nghĩa. Việc sai này có thể do định nghĩa sai, hoặc do nghiệp vụ thay đổi. Xem thêm tại  Quản lí chất lượng dữ liệu Việc đối soát dữ liệu trong hệ thống có sự trao đổi thông tin(trao đổi nội bộ giữa các phân hệ hoặc giữa ứng dụng với ứng dụng khác) là nghiệp vụ thường xuyên nhằm duy trì chất lượng dữ liệu. Trong bài này, tôi chỉ tập trung vào việc đối soát dữ liệu giữa các phiên bản được lưu trữ tại các kho khác nhau. Kho trong trường hợp này, tôi xem xét là 1 cơ sở dữ liệu quan hệ(oracle, mysql, sql server). Nguyên lý quản lý đối soát dữ liệu: 1.RÀNG BUỘC - Nguyên tắc: chỉ đối soát sự tồn tại với phiên bản dữ liệu (data version), không đối soát chi tiết thuộc tính của thực thể(item) - Lý do: Tất cả các nghiệp vụ trao đổi thông tin đã được xử lý theo giao dịch 2. VẤN ĐỀ MỤC TIÊU - Đối soát với