Benford's Law là gì?
Định luật
Benford mô tả phân bố tần suất tương đối cho các chữ số đứng đầu của các số
trong bộ dữ liệu. Chữ số hàng đầu với giá trị nhỏ hơn xảy ra thường xuyên hơn
so với giá trị lớn hơn. Luật này quy định rằng khoảng 30% số bắt đầu bằng số 1
trong khi chưa đến 5% bắt đầu bằng số 9. Theo luật này, số 1 đứng đầu xuất hiện
thường xuyên gấp 6,5 lần so với số 9 đứng đầu! Luật của Benford còn được gọi là
Luật chữ số đầu tiên.
Nếu các
chữ số đầu từ 1 – 9 có xác suất bằng nhau, thì chúng sẽ xuất hiện với tỷ lệ
11,1%. Tuy nhiên, điều đó không đúng trong nhiều bộ dữ liệu. Biểu đồ hiển thị
phân phối các chữ số hàng đầu theo luật của Benford. Phân tích các bộ dữ liệu
cho thấy nhiều trường hợp tuân theo định luật Benford. Ví dụ: các nhà phân tích
đã phát hiện ra rằng giá cổ phiếu, dân số, tỷ lệ tử vong, thống kê thể thao, lượt
thích trên TikTok, thông tin tài chính và thuế cũng như số tiền thanh toán thường
có các chữ số đứng đầu tuân theo phân phối này.
(Nguồn: https://www.journalofaccountancy.com/issues/2017/apr/excel-and-benfords-law-to-detect-fraud.html)
Một
số ứng dụng của luật Benford
Các nhà phân tích đã sử dụng
nó rộng rãi để tìm kiếm gian lận và thao túng trong hồ sơ tài chính, tờ khai
thuế, đơn đăng ký và tài liệu ra quyết định. Họ so sánh việc phân phối các chữ
số hàng đầu trong các bộ dữ liệu này với luật của Benford. Khi các chữ số đầu
không tuân theo phân phối, đó là dấu hiệu cảnh báo gian lận trong một số bộ dữ
liệu.
Ý tưởng đằng sau lý do tại
sao điều này hoạt động là đơn giản. Khi mọi người thao túng các con số, họ
không theo dõi tần suất của các chữ số đầu giả, tạo ra sự phân bố các chữ số đầu
không tự nhiên. Trong một số trường hợp, họ có thể điều chỉnh một cách có hệ thống
các chữ số ở đầu dưới một giá trị ngưỡng cụ thể. Ví dụ: nếu có giới hạn 100.000
đô la cho một loại giao dịch, những kẻ lừa đảo có thể bắt đầu nhiều số bằng số
9 với giá 99.000 đô la.
Việc sử dụng luật của
Benford để phát hiện hành vi gian lận được chấp nhận tại các tòa án địa phương,
tiểu bang và liên bang của Hoa Kỳ. Trước đây, cơ quan này đã phát hiện ra những
điểm bất thường trong đơn đăng ký ở Liên minh Châu Âu của Hy Lạp và dữ liệu
hoàn vốn đầu tư cho các kế hoạch Ponzi, chẳng hạn như của Bernie Madoff.
Tuy nhiên, có một số lưu ý quan trọng.
·
Khi tập dữ liệu mà bạn mong đợi sẽ không tuân
theo đường cong của Benford, thì đó chỉ là dấu hiệu cảnh báo chứ không phải bằng
chứng gian lận. Bạn vẫn cần gửi kiểm toán viên và điều tra viên, nhưng ít nhất
bạn có thể nhắm mục tiêu họ hiệu quả hơn trên các hồ sơ đáng ngờ.
·
Hơn nữa, không phải tất cả dữ liệu đều tuân theo
định luật Benford một cách tự nhiên. Trong những trường hợp đó, các chữ số đầu
theo một phân phối khác không phải là dấu hiệu gian lận. Do đó, điều quan trọng
là phải biết bộ dữ liệu nào phù hợp để so sánh với nó—điều này sẽ đưa chúng ta
đến phần tiếp theo
Tài liệu tham khảo
[1]. https://www.journalofaccountancy.com/issues/2017/apr/excel-and-benfords-law-to-detect-fraud.html
[2].
https://statisticsbyjim.com/probability/benfords-law/
[3].
https://builtin.com/data-science/benfords-law
[4].
https://www.statisticshowto.com/benfords-law/
Không có nhận xét nào:
Đăng nhận xét