2018年07月12日

統計解析とAI ~画像認識による自動検査への活用~

AI(人工機能)が社会を変える、専門家の職業にAIが取って替わる時代が近いなど
AIの話題には事欠かない。                                                                                  
                                                                                                 
全自動洗濯機やロボットがロボットを作っているうちは通常の科学や技術の進歩として、さほど驚くには当たらないが、車の自動運転や医者の替わりをするとなるとこれは革命である。   
                                                                      
AI(人工知能)の特性は、
(1)人間の脳を研究したモデルから、ニューラルネットワーク・ディープラーニングといって、学習をしながら賢く進化していくAIと、                                                   
(2)機械学習といって、あくまで大量データに統計的判断を行って区分けしたり、確率的な判断をさせる特徴をもったAI                     
の大きく2つに分かれる。

(2)については、統計解析を仕事の中で活用したことがあったので、この領域なら理解できるかもしれない。                                                                              
 
統計解析のひとつである「判別分析」の活用例として、                                                    
・これまで全国に49店のスーパーを出店した。                                                                
・出店の業績(成功か失敗)をyとして、出店先の人口、交通量、所得水準、公園の面積などを(x1、x2、x3、・・)とすると、y=f(x1、x2、x3、・・)という関係式が49組できる。
・x1、x2、・・は客観的に獲得できる情報であり、独立変数と呼ばれる。
・これに対し、yは結果であり、失敗して撤退することがあれば、高い授業料を払ったことを意味し、従属変数と呼ばれる。   
・この49組の実績データから(x1、x2、・・)がどういうときにyの成功する確率が高くなるかを表す「判別式(関数)」を作る。                                                                                 
・その後、新たな50番目の出店として、A,B,Cの候補地があったときにそれぞれの人口や交通量などのx値を「判別関数」にかけてyの値を求めると、どの店の成功確率が高いかがわかり、経験と勘を数値に置き換えて意思決定できるという仕掛けである。 
                                                                                                                                                                            
また、「クラスター分析」と言う統計解析では、                                             
クラスターとは、群、塊り、集合体と言う意味であるが、データのグループ分けをグループの重心と各点との距離から、クラスターに分ける手法である。 
例えば人間の顔の画像データをインプットすると、目か鼻かなどデジタルデータを区分けした集合体として認識できる。                                                                     
 
猫の写真を何枚も撮って、これが「猫」だとコンピュータに教えておいたときに別の写真を見せて「猫」かどうか判定する場合はこうした分析手法やさらに「因子分析」によって、「固有値」を算出するというコンピュータが得意の領域がある。  
 
AIのプログラムを組むことは私にはできないが、 
「猫」を”製品"に、「他の動物写真」を"異品(不良品)”と置き換えると画像認識による異品の検査ができる。原理が同じなら、活用してみたいと思う。                         
前提条件として、画像認識するためのパッキンなどの製品が、カメラの下に1個づつ行儀よく並ぶかどうかが問題であるが・・・。          


2017年12月14日

希望ナンバープレートの市場規模を推測する

朝晩それぞれ1時間かけて車通勤している。
知多市の産業道路を北上し、23号線、1号線を走って会社に到着する。
往きは大体CBCラジオ "朝からPON"を聴きながら、渋滞と退屈に耐えているのだが
退屈紛れに車のナンバープレートを眺めていると、日付のナンバー ・1-01から
12-31が目立って多いような気がしたので、ちょっと以下のような推測を試みた。
ナンバーは0001から9999の9999通りであるが、計算上は0000もあることに
して、1万個とする。
2月29日(0229)は除くとすると、日付ナンバーは365個あるから 
365÷10,000=0.0365。
逆数は27.4になるので、確率上、日付ナンバーの平均台数は27台に1台
となるが、信号待ちや追い越していく車のナンバーを観察して、日付ナンバー
と総台数をざっとカウントしてみると、
仮説:『少なくとも10台に1台は日付ナンバーである』
といえるのではないか。

統計学の世界からもう少し慎重に見直すと
(1) 全国で走っている何千万台の車を「母集団」としたとき
(2) 私がカウントしている通勤路(標本空間)は偏りなく「母集団」を反映している
  といいきってよいだろうか?

私は行き帰りともほぼ同じ時間帯で同じ道を走っている。共に走っている常連
の仲間もいるだろう。通勤時間帯に通勤する車が、知多市と名古屋市中川区の
間を行き来し、主婦やレジャー目的の車はほとんど走っていない状況なので、
サンプリング上、多少偏っているかもしれないが、(退屈しのぎのはなしなので)
あまり気にしないで、仮説をやや緩めて13台に1台が日付ナンバーだとしよう。
1年間に300万台がナンバー登録するとしたら、
300万台×(1/13-1/27)=119,658台は、意図的に希望して日付ナンバー
を取得したことになる。
1台につき5千円を加算して払うとすれば、希望ナンバービジネスは約6億円/年
の市場になるのだろうか。
日付の他に、1桁の数字や7777などのゾロ目は抽選取得になるほど人気が高い
らしく、縁起の悪いナンバーを変えたいという人もいるだろうから、それらを加味す
ると、市場規模金額はもっと高くなるのかもしれない。
情報システムの開発費用を除けば、おいしいビジネスになるわけで、
ものづくり製造業者からみると少しうらやましい・・・。

・・・・・というようなことを思いながらハンドルを握っていたことがあります。
いつか大きな駐車場で検証してみましょう。

関心の分野が違う人にとっては、理屈っぽくて面白くも何ともない内容でした。
悪しからず・・・。


 




このページのトップへ