Thứ Hai, 27 tháng 3, 2023

Benford's Law

Benford's Law là gì?

Định luật Benford mô tả phân bố tần suất tương đối cho các chữ số đứng đầu của các số trong bộ dữ liệu. Chữ số hàng đầu với giá trị nhỏ hơn xảy ra thường xuyên hơn so với giá trị lớn hơn. Luật này quy định rằng khoảng 30% số bắt đầu bằng số 1 trong khi chưa đến 5% bắt đầu bằng số 9. Theo luật này, số 1 đứng đầu xuất hiện thường xuyên gấp 6,5 lần so với số 9 đứng đầu! Luật của Benford còn được gọi là Luật chữ số đầu tiên.

Nếu các chữ số đầu từ 1 – 9 có xác suất bằng nhau, thì chúng sẽ xuất hiện với tỷ lệ 11,1%. Tuy nhiên, điều đó không đúng trong nhiều bộ dữ liệu. Biểu đồ hiển thị phân phối các chữ số hàng đầu theo luật của Benford. Phân tích các bộ dữ liệu cho thấy nhiều trường hợp tuân theo định luật Benford. Ví dụ: các nhà phân tích đã phát hiện ra rằng giá cổ phiếu, dân số, tỷ lệ tử vong, thống kê thể thao, lượt thích trên TikTok, thông tin tài chính và thuế cũng như số tiền thanh toán thường có các chữ số đứng đầu tuân theo phân phối này.

 


(Nguồn: https://www.journalofaccountancy.com/issues/2017/apr/excel-and-benfords-law-to-detect-fraud.html)

Một số ứng dụng của luật Benford

Các nhà phân tích đã sử dụng nó rộng rãi để tìm kiếm gian lận và thao túng trong hồ sơ tài chính, tờ khai thuế, đơn đăng ký và tài liệu ra quyết định. Họ so sánh việc phân phối các chữ số hàng đầu trong các bộ dữ liệu này với luật của Benford. Khi các chữ số đầu không tuân theo phân phối, đó là dấu hiệu cảnh báo gian lận trong một số bộ dữ liệu.

Ý tưởng đằng sau lý do tại sao điều này hoạt động là đơn giản. Khi mọi người thao túng các con số, họ không theo dõi tần suất của các chữ số đầu giả, tạo ra sự phân bố các chữ số đầu không tự nhiên. Trong một số trường hợp, họ có thể điều chỉnh một cách có hệ thống các chữ số ở đầu dưới một giá trị ngưỡng cụ thể. Ví dụ: nếu có giới hạn 100.000 đô la cho một loại giao dịch, những kẻ lừa đảo có thể bắt đầu nhiều số bằng số 9 với giá 99.000 đô la.

Việc sử dụng luật của Benford để phát hiện hành vi gian lận được chấp nhận tại các tòa án địa phương, tiểu bang và liên bang của Hoa Kỳ. Trước đây, cơ quan này đã phát hiện ra những điểm bất thường trong đơn đăng ký ở Liên minh Châu Âu của Hy Lạp và dữ liệu hoàn vốn đầu tư cho các kế hoạch Ponzi, chẳng hạn như của Bernie Madoff.

Tuy nhiên, có một số lưu ý quan trọng.

·      Khi tập dữ liệu mà bạn mong đợi sẽ không tuân theo đường cong của Benford, thì đó chỉ là dấu hiệu cảnh báo chứ không phải bằng chứng gian lận. Bạn vẫn cần gửi kiểm toán viên và điều tra viên, nhưng ít nhất bạn có thể nhắm mục tiêu họ hiệu quả hơn trên các hồ sơ đáng ngờ.

·      Hơn nữa, không phải tất cả dữ liệu đều tuân theo định luật Benford một cách tự nhiên. Trong những trường hợp đó, các chữ số đầu theo một phân phối khác không phải là dấu hiệu gian lận. Do đó, điều quan trọng là phải biết bộ dữ liệu nào phù hợp để so sánh với nó—điều này sẽ đưa chúng ta đến phần tiếp theo

 

Tài liệu tham khảo

[1]. https://www.journalofaccountancy.com/issues/2017/apr/excel-and-benfords-law-to-detect-fraud.html

[2].         https://statisticsbyjim.com/probability/benfords-law/

[3].         https://builtin.com/data-science/benfords-law

[4].         https://www.statisticshowto.com/benfords-law/

 

 

 

 

 

Không có nhận xét nào:

Đăng nhận xét

Sandbox

Thuật ngữ "sandbox" trong bối cảnh công nghệ được dùng để chỉ một môi trường thử nghiệm an toàn, trong đó các phần mềm, chương tr...