Forensic Accounting

Benford’s law, also called the first-digit law, states that in lists of numbers from many (but not all) real-life sources of data, the leading digit is distributed in a specific, non-uniform way. According to this law, the first digit is 1 about 30% of the time, and larger digits occur as the leading digit with lower and lower frequency, to the point where 9 as a first digit occurs less than 5% of the time.

Mathematical statement

… this is the distribution expected if the logarithms of the numbers (but not the numbers themselves) are uniformly and randomly distributed. For example, a one-digit number x starts with the digit 1 if 1 <= x < 2, and starts with the digit 9 if 9 <= x < 10. Therefore, x starts with the digit 1 if log 1 <= log x < log 2, or starts with 9 if log 9 <= log x < log 10. The interval [log 1, log 2] is much wider than the interval [log 9, log 10] (0.30 and 0.05 respectively); therefore if log x is uniformly and randomly distributed, it is much more likely to fall into the wider interval than the narrower interval, i.e. more likely to start with 1 than with 9.

Explanations

Outcomes of exponential growth processes

The precise form of Benford’s law can be explained if one assumes that the logarithms of the numbers are uniformly distributed; for instance that a number is just as likely to be between 100 and 1000 (logarithm between 2 and 3) as it is between 10,000 and 100,000 (logarithm between 4 and 5). For many sets of numbers, especially sets that grow exponentially such as incomes and stock prices, this is a reasonable assumption.

Applications

In 1972, Hal Varian suggested that the law could be used to detect possible fraud in lists of socio-economic data submitted in support of public planning decisions. Based on the plausible assumption that people who make up figures tend to distribute their digits fairly uniformly, a simple comparison of first-digit frequency distribution from the data with the expected distribution according to Benford’s law ought to show up any anomalous results.

Following this idea, Mark Nigrini showed that Benford’s law could be used in forensic accounting and auditing as an indicator of accounting and expenses fraud. In the United States, evidence based on Benford’s law is legally admissible in criminal cases at the federal, state, and local levels.

Limitations

Benford’s law can only be applied to data that are distributed across multiple orders of magnitude.

— Wikipedia on Benford’s law

2012.05.15 Tuesday ACHK

古怪題目 1.1

這段改編自 2010 年 6 月 2 日的對話。

你以為很需要創意的東西,可能根本在 past paper(歷屆試題)中出現過。只要你前先背誦好,那些現成可用的技巧,你就不會再覺得那類題目「很需要創意」。

(CYW:平日做功課或測驗時,可能會遇到有些題目類型,我沒有在歷屆試題中見過。那樣,我想背誦那些技巧也背不到。)

凡是有些題目十分奇怪,奇怪到一個程度是,它們的類型,根本在眾多年的歷屆試題中,從來未出現過,你就會知道,那類題目不是課程的重點,在未來試題出現的機會很微。換句話說,它們對你分數的影響很少。那你又何必去理會它們?

(CYW:假設我考試想拿到 A 級成績。如果有些「十分古怪題目」,剛巧在我那一屆的試題出現,我就拿不到 A。)

無錯。所以,對於「A 級成績人士」來說,應該間中做一些「十分古怪題目」,以備不時之需。

但是,你要留意,做事應該分輕重緩急。溫習的時間相當有限。你應該先溫習「必考」的題目,然後才溫習「多考」的題目。行有餘力,就可以研究「少考」的題目。之後,竟然還有時間剩餘的話,你才可以鑽牛角尖,研究那些「十分古怪」,幾乎沒有機會考的題目。

— Me@2012.05.14

2012.05.14 Monday (c) All rights reserved by ACHK

溫習內疚 1.1

這段改編自 2010 年 6 月 2 日的對話。

我現在教你們的讀書方法,我自己年輕時,是不知道的。還有,有時回想起年輕時候的自己,會十分驚嘆,為何一個人可以那麼愚蠢。例如:

年青人的指定劇情是,會因為沒有溫習而內疚。然後又會因為內疚,而沒有心機溫習。接著再會因為繼續沒有溫習,而加倍內疚,如此類推。

你們懂得笑,即是有同感。那就證明了「在不適當的時候內疚」,並不只是個別人士的問題,而且是很多人都會有的問題。

— Me@2012.05.12

2012.05.12 Saturday (c) All rights reserved by ACHK

驗算技巧儲備

這段改編自 2010 年 6 月 2 日的對話。

絕大部分類型的題目,都有對應的驗算技巧。你要在平日就學習定那些技巧,把它們儲存於「魔法筆記」之中。只要事前詳加背誦,考試時就可以高速運用。

如果有某一類題目,你想像不到有什麼驗算技巧的話,你就一定要立刻問我。

— Me@2012.05.04

2012.05.04 Friday (c) All rights reserved by ACHK

微積分驗算 1.4.2

這段改編自 2010 年 6 月 2 日的對話。

你做題目做得慢的原因是,你不夠純熟。相反,你在平日已經訓練到自己足夠純熟的話,你就自然做得快。做得快,就自然有足夠的時間剩下來,作驗算之用。

正如,我問你 2 乘 3 是多少的話,你會立刻答我 6,而毋須經過任何有意識的刻意思考。如果你竟然需要花一秒的時間去思考,你就即是不熟悉乘數表。換句話說,你不懂做乘法。同理,其他課題的運算,凡是你需要明顯思考的,都是你不夠純熟,沒有把握的東西。你應該加重訓練,除非該個課題無關痛癢。

— Me@2012.05.02

2012.05.02 Wednesday (c) All rights reserved by ACHK

微積分驗算 1.4

這段改編自 2010 年 6 月 2 日的對話。

(CYW: 用兩種方法運算同一題,而答案相同的話,錯的機會就很微。但是,考試時,哪會有那麼多的時間?)

那就要靠你平日的訓練。你要在考試前,訓練到自己,每當做一題價值(例如)三分鐘時間的題目時,都可以在兩分鐘內完成。而餘下的一分鐘,你就可以用來驗算。

— Me@2012.04.30

2012.04.30 Monday (c) All rights reserved by ACHK

微積分驗算 1.3

這段改編自 2010 年 6 月 2 日的對話。

又再例如,求 d/dx (1/sqrt{x}) 時,你直接計算了以後,可以同時用「消滅分母法」和「消滅開方法」去驗算:

y = 1/sqrt{x}

y^2 = 1/x

x y^2 = 1

左右兩邊同時對 x 求導:

(Differentiate both sides with respect to x:)

(dx/dx) y^2 + x d/dx (y^2) = d(1)/dx

y^2 + x 2 y dy/dx = 0

2 x y dy/dx = – y^2

dy/dx = – y/(2x)

dy/dx = – (1/sqrt{x})/(2x)

dy/dx = – 1/(2 x sqrt{x})

— Me@2012.04.28

2012.04.28 Saturday (c) All rights reserved by ACHK

微積分驗算 1.2

這段改編自 2010 年 6 月 2 日的對話。

又例如,求 d/dx (1/x) 時,你既可以直接計算,又可以用「消滅分母法」:

y = 1/x

x y = 1

左右兩邊同時對 x 求導:

(Differentiate both sides with respect to x:)

(dx/dx) y + x dy/dx = d(1)/dx

y + x dy/dx = 0

dy/dx = -y/x

dy/dx = (-1/x)/x

dy/dx = -1/x^2

凡是有分母的 function(函數)做 differentiation(求導),你都可以用這個「消滅分母法」去驗算。

再例如,求 d/dx (sqrt{x}) 時,你既可以直接計算,又可以用「消滅開方法」:

y = sqrt{x}

y^2 = x

左右兩邊同時對 x 求導:

(Differentiate both sides with respect to x:)

d/dx (y^2) = dx/dx

2y dy/dx = 1

dy/dx = 1/2y

dy/dx = 1/(2 sqrt{x})

凡是有開方的 function(函數)做 differentiation(求導),你都可以用這個「消滅開方法」去驗算。

— Me@2012.04.25

2012.04.25 Wednesday (c) All rights reserved by ACHK

微積分驗算 1.1

這段改編自 2010 年 6 月 2 日的對話。

考試時,你怕做錯 differentiation 的話,就應該做驗算。驗算的方法有兩種。你選擇其中一種方法去用就可以。

第一種方法是,做了 differentiation 後,用計數機核對。現在,有一些計數機,有 differentiation 的功能。

第二種方法是,你用超過一種途徑,去運算同一題 differentiation,看看可不可以得到同一個答案。例如,如果要運算 d/dx ( sin x / x ),你既可以用 product rule,又可以用 quotient rule。

用 product rule 的話,你就要把「sin x 除以 x」看成「sin x 乘以 1/x」。

— Me@2012.04.23

2012.04.23 Monday (c) All rights reserved by ACHK

機會率反反思

這段改編自 2010 年 6 月 2 日的對話。

你這道機會率題目做錯了。我建議你不要自己追究,自己的想法錯在哪裡,因為,有時一些錯誤的想法,很難可以自己指出錯在何處,除非你的造詣,已經達到大師的級數。

例如,你試一試指出,以下的論證,有何不妥之處:

擁有一支筆 好過 沒有任何東西;

沒有任何東西 好過 擁有一位好太太。

結論:

擁有一支筆 好過 擁有一位好太太。

如果想追究想法錯在哪裡,你可以直接問我。我的機會率精神狀態,間中會達到大師的境界。

— Me@2012.04.19

2012.04.19 Thursday (c) All rights reserved by ACHK

機會率分母

這段改編自 2010 年 6 月 2 日的對話。

機會率是一個分數。分子代表期望的結果;分母代表已知的東西,又名「樣本空間」。

即使期望的事件相同,如果已知的東西不同,都會導致機會率的數值有分別。例如,假設有一粒骰子是公平的,即是各個結果出現的機會率均等。如果要擲到「3」,機會率是多少呢?

期望的結果只有一個,就是擲到「3」,所以機會率分子是 1。樣本空間,就是所有可能結果的集合,即是{1, 2, 3, 4, 5, 6}。樣本空間,顯示總共有 6 個可能的結果,所以機會率分母是 6。答案是,擲到「3」的機會率是 1/6。

但是,如果你已知結果一定是單數,樣本空間就會收窄成{1, 3, 5}。因為現在只有 3 個可能的結果,機會率分母應該改為 3。結論是,擲到「3」的機會率是 1/3。

你現在用「集合論」中的「文氏圖」(Venn diagram),來分析一題機會率題目,理論上是合理的。但是,實際上,你要十分小心,因為「文氏圖」所直接表達的,只有期望的結果,即是「機會率分子」。稍一不留神,你會忘記了,還要考慮「樣本空間」,即是「機會率分母」。

— Me@2012.04.17

2012.04.17 Tuesday (c) All rights reserved by ACHK

Probability 3.3

這段改編自 2010 年 6 月 2 日的對話。

15 個錢幣之中,有 3 個是金的。假設你要由那 15 個錢幣之中,抽 4 個出來,抽到 3 個金幣的機會率是多少?

已知整個過程是隨機的,即是抽中各個錢幣的機會均等。

這一題有兩種運算方法。

第一種運算方法,我稱之為「機會率方法」,簡稱「P」。

我現在解釋,使用「P 方法」時,為何在那四個分數之後,要乘多一個 4C3。(4C3 即是 「4 選 3」,等於 4。)

我剛才考慮,抽到「頭三個是金」和「尾一個非金」的機會率是多少?

(金)(金)(金)(X) = (3/15)(2/14)(1/13)(12/12)

但是,原本的題目並沒有規定 4 個錢幣之中,哪 3 個是金的,所以,我們還要用同樣的方法,思考其他的可能性:

(金)(金)(金)(X) = (3/15)(2/14)(1/13)(12/12)

(金)(金)(X)(金) = (3/15)(2/14)(12/13)(1/12)

(金)(X)(金)(金) = (3/15)(12/14)(2/13)(1/12)

(X)(金)(金)(金) = (12/15)(3/14)(2/13)(1/12)

只要把上面 4 個機會率加在一起,就是你要的最終答案。但是,那樣做會十分費時失事。有沒有快一點的做法呢?

有。只要利用一個簡單的觀察就可以。以上的 4 組數中的每一組,都是由 4 個分數相乘而成。雖然,例如,第一組的四個分數,並不同於第二組的那四個,但是,它們的分子,都是由那四個數「3、2、1、12」相乘而成的。唯一的分別,是次序不同。所以相乘以後,4 組數的數值是相同的。

(金)(金)(金)(X) = (72/32760)

(金)(金)(X)(金) = (72/32760)

(金)(X)(金)(金) = (72/32760)

(X)(金)(金)(金) = (72/32760)

既然是那樣,與其逐個運算,倒不如先計「(金)(金)(金)(X)」的機會率,然後乘以 4,直接獲取最終答案。

(3/15)(2/14)(1/13)(12/12)4 = 0.008791

那樣,為何我們會知道,總共只有 4 個排法?或者說,我們如何保證,沒有漏網之魚呢?

不同排法,代表那 3 個金幣,放於 4 格之中的不同位置。換句話說,你只需要思考,4 格之中放 3 個金幣,總共會有多少個方法。所以,答案是 4C3。 4C3 即是 「4 選 3」,等於 4。

(3/15)(2/14)(1/13)(12/12)4C3 = 0.008791

我現在只是令你理解,為何在那四個分數之後,要乘多一個 4C3。到你自己做題目時,毋須思考得那麼詳細。你只需要懂得這樣想就可以:

4 個錢幣中,有 3 個是金的,而題目又沒有規定是哪 3 個,所以,要乘多一個 4C3。

— Me@2012.04.13

2012.04.13 Friday (c) All rights reserved by ACHK

Probability 3.2

這段改編自 2010 年 6 月 2 日的對話。

15 個錢幣之中,有 3 個是金的。假設你要由那 15 個錢幣之中,抽 4 個出來,抽到 3 個金幣的機會率是多少?

已知整個過程是隨機的,即是抽中各個錢幣的機會均等。

這一題有兩種運算方法。

第二種運算方法,我稱之為「統計學方法」,簡稱「S」。

這個方法,是直接用一個分數,來獲得答案。

(_)
(  )

首先,你要想像,總共有多少個抽法:

15 個錢幣中抽 4 個,共有 15_C_4 種抽法,所以分母是 15_C_4。

(___ )
(15_C_4)

15_C_4 即是 「15 選 4」,等於 1365。

然後,你再想一想,在這 1365 個可能之中,有多少個是你想要的結果(其中三個金):

第一,你要巧合地從那 3 個金幣之中,抽到全部 3 個出來。那共有 3_C_3 種抽法。

第二,你要幸運地從那 12 個非金幣之中,抽到 1 個出來。那共有 12_C_1 個可能性。

所以,分子是〔(3_C_3)(12_C_1)〕。

(3_C_3)(12_C_1)
__________ = 0.008791
        (15_C_4)

這個方法,是透過幾個「點算數目」來獲得答案,所以,我稱之為「統計學方法 S」。

「點算數目」的意思是,點算有多少個可能的結果,放在分母;然後,再點算眾多可能結果之中,有多少個是你想要的,放在分子。那樣,整個運算過程中,就不會出現多過一個分數。

因為「P 方法」和「S 方法」貌似截然不同,你幾乎沒有可能,錯在同一個地方。如果你用齊這兩個方法,都「竟然」計到同一個答案,你錯的機會就微乎其微。

據我現時所知,同時用 P、S 方法,不單是驗算機會率題目的最佳方法,而且是唯一方法。

機會率題目的好處是,如果你想得通,運算的步驟極少。即使你每一題機會率題目,也同時用這兩個方法運算,也不會花你太多時間。

— Me@2012.04.11

2012.04.11 Wednesday (c) All rights reserved by ACHK

Probability 3.1

這段改編自 2010 年 6 月 2 日的對話。

15 個錢幣之中,有 3 個是金的。假設你要由那 15 個錢幣之中,抽 4 個出來,抽到 3 個金幣的機會率是多少?

已知整個過程是隨機的,即是抽中各個錢幣的機會均等。

這一題有兩種運算方法。

第一種運算方法,我稱之為「機會率方法」,簡稱「P 」。

P 方法:

首先,假想有四個空格:

(_)(_)(_)(_)

然後,你要抽四個錢幣出來,逐一填滿那四個空格。為簡便起見,我們暫時先把題目改為:抽到「頭三個是金」和「尾一個非金」的機會率是多少?

(金)(金)(金)(X)

接著,你可以考慮,第一個抽到金幣的機會是多少。因為原本有 15 個錢幣給你抽,所以第一個分數的分母是 15。那 15 個錢幣中,有 3 個是你所要的金幣,所以第一個分數的分子是 3。結論是,第一個分數是 3/15。

(3/15)(金)(金)(X)

到你抽第二個錢幣時,只剩下 14 個,所以第二個分母是 14。那 14 個錢幣中,還有兩個是金的,所以第二個分子是 2。

(3/15)(2/14)(金)(X)

如此類推,你亦可以得到餘下的兩個分數。

(3/15)(2/14)(1/13)(12/12)

但是,原本的題目並沒有規定 4 個錢幣之中,哪 3 個是金的,所以,我們要乘 4C3 於剛才的那個中途答案之上,因為,4 個之中放 3 個金幣,共有 4C3 種放法。4C3 即是 「4 選 3」,等於 4。

(3/15)(2/14)(1/13)(12/12)4C3 = 0.008791

這個方法,是透過幾個「機會率分數」的相乘來獲得答案,所以,我稱之為「機會率方法 P」。

— Me@2012.04.09

2012.04.09 Monday (c) All rights reserved by ACHK

唔識就飛 9

這段改編自 2010 年 5 月 26 日的對話。

.

* This item was deleted.

Note. Figures in brackets indicate the percentages of candidates choosing the correct answers.

General note on item deletion

It is normal for the HKEAA to delete a small number of items from its multiple-choice question papers if they prove unsatisfactory. In practice, there are a number of reasons why this is considered necessary. By far the most common reason for deleting an item is that the item fails to discriminate between weak and able candidates — in other words, the majority of the candidates involved had to rely on guesswork in answering that question. If such an item is retained, the measurement process is rendered less effective. Where items have been deleted in the live papers, they are still included in this series of publications. They are indicated as deleted items. Such items may be discussed in the corresponding examination reports.

— HKEAA

.

在香港的中學公開試中,間中有一些多項選擇題(multiple choices),會在考試後被考試局刪除。換句話說,那些題目的分數,不會計算在總分之中。

某一題被刪除,其中一個可能的原因是,該題每個答案的選擇人數差不多,都是大概 25%。那就即是話,大部分人也是隨意估計的。那樣,該題就失去了考試的意義,因為它不能再用來,判別考生學問的高低。

對於任何一題,只要在指定時間內想不到,就應該立刻暫時放棄。你應先隨機填一個答案,待完成了其他題目,還有時間剩餘的話,才回來再想。除了我以前講的理由外,現在還多了一個考慮:

某一題所需的思考時間過長,並不一定是因為你的才能不及。那亦可能是該題過深,根本絕大部分其他考生也不懂做。如果你堅持要完成,即使最終得到正確答案,也會得不償失。一來,你已經用了過多的時間,導致自己來不及,妥善完成其他題目。二來,該題最終可能被取消。

留意,即使決定了暫時放棄某一題,你也一定要先隨機填一個答案,才去做下一題。在多項選擇題的答題紙上,留下空格,是極之危險的事情,因為那可能會導致你,往後題目的答案「轉移」,全部填錯位置。

— Me@2012.03.23

.

.

2012.03.23 Friday (c) All rights reserved by ACHK

醫生原理 2

這段改編自 2010 年 5 月 26 日的對話。

千萬不要有一個心結:我要做一個勤力的學生。你真正需要追求的,是學問和成績,而不是「勤力」。「勤力」只是手段之一,而不是最終目的。

如果「勤力」可以令我的學問成功,我就會勤力起來。相反,另一些時候,「懶惰」反而對我有利的話,我就會懶惰一番。或者說,最好的學生,並不是最「勤力」的學生。最好的學生,會懂得在哪些地方勤力、哪些地方懶惰。正如,人能在眾多動物中脫穎而出,並不是因為人比其他動物勤力。 

在人生大部分的劇情中,勤不勤力,也似乎沒有什麼重要的關係。

例如,如果公開試的成績上佳,就一定會有大學取錄你。相反,即使你是地球上,最勤力的那個人,如果公開試的成績不足,大概也沒有大學會取錄你。一來,勤不勤力,並不是重點。二來,大學又怎會有辦法,判斷你勤不勤力呢?

又例如,你看醫生時,那個醫生勤不勤力,並不是重點。你真正關心的是,他可不可以醫好你。假設,有一位醫生十分「懶惰」,只肯花一分鐘,去診斷你的病症。但是,他往往能解決你的問題。那樣,你不會介意他的「懶惰」。相反,假設有一位醫生十分勤力。但是,他沒有足夠的才智,去治癒你病痛。那樣,你還敢去看他嗎?

人生的時間十分有限,一切有機會成本。在無關痛癢的地方勤力,就會導致你沒有足夠時間,去處理真正重要的事情。在不重要的地方勤力,就相當於在重要的地方懶散,得不償失。

— Me@2012.03.18

2012.03.19 Monday (c) All rights reserved by ACHK

功夫傻瓜 2.2

中學實驗報告 3.2

這段改編自 2010 年 5 月 26 日的對話。

如果你的老師是合理的,他所出功課的形式,自然會貼近公開試題目。即使他間中出了一些無用的功課,只要你向他反映,他亦自然會立刻刪除之。這是第零步

如果不幸,你的老師是非理性的,你就應該用我之前所講,面對「中學實驗報告」的方法,去對付那堆無用的功課。

第一步,從質素方面入手:

在你的能力範圍內,把那份無用的功課,做到最差,直到剛剛維持到,最最基本的質素為止。

盡量做差,一方面可以為你節省最多的時間,去研習其他有用的功課。另一方面,它會令你的老師,心裡有一點兒不舒服。那樣,你就相當於向他暗示了:「請不要給予我,無實質用處的功課。」

但是,你要記緊,要「維持到最最基本的質素」。那樣,即使他不舒服,也不可以責備你。

第二步,從時間方面入手:

在你的能力範圍內,把那份無用的功課,盡量遲一點遞交。換句話說,即是臨限期前,你才容許那份功課,重見天日。

因為「長年累月」,那份功課在表面上,也苦無進展,你的老師,心裡自然有一點兒不舒服。那樣,你就相當於向他暗示了:「請不要給予我,無實質用處的功課。」

但是,你要記緊,一定不要遲過限期。那樣,即使他不舒服,也不可以責備你。

第三步,從「件數」方面入手:

每十件荒唐的功課中,你只做九件。剩下的一樣,你要堅持不做不理。

十件功課中,偏偏有一件未能完成,你的老師,心裡自然有一點兒不舒服。那樣,你就相當於向他暗示了:「請不要給予我,無實質用處的功課。」

但是,你要記緊,另外的九件,一定要完成。那樣,因為他給予的任務中,你大部分也能夠完成,即使他不舒服,也不可以責備你。

這些步驟的中心思想是,實事求是,虛事求非。又或者,實事實做,虛事虛做。人生苦短,浪費時間等如縮短自己的生命,不可原諒。如果你竟然把無謂的東西,做得好、做得快、做得齊的話,你就會越做越多無謂的東西,因為你的上司/老師會以為,他們的政策正確,自然會變本加厲。

— Me@2012.03.16

2012.03.16 Friday (c) All rights reserved by ACHK

功夫傻瓜 2.1

中學實驗報告 3.1

這段改編自 2010 年 5 月 26 日的對話。

不做傻瓜的話,你就要懂得權衡輕重,先做成本效益最高的東西。眾多功課之中,令你的考試分數提升得最多的,就是第一要務。如果時間不足,你就千萬不要企圖,去完成「所有」功課的「所有」部分。你真正必須「完成」的,是第一要務。其他功課,無論你有多麼掛念,都應暫時完全拋諸腦後,直到完成第一要務為止。完成了第一要務後,才開始第二要務,如此類推。

對於公開試的考生來說,校內的功課,通常也沒有什麼大用。真正重要的功課,是 past paper(歷屆試題),或者類似 past paper 的題目。在你眾多功課之中,那是你需要最先完成的東西。

如果你的老師是合理的,他所出功課的形式,自然會貼近公開試題目。即使他間中出了一些無用的功課,只要你向他反映,他亦自然會立刻刪除之。

如果不幸,你的老師是非理性的,你就應該用我之前所講,面對「中學實驗報告」的方法,去對付那堆無用的功課。

— Me@2012.03.14

2012.03.14 Wednesday (c) All rights reserved by ACHK