ゼミの期末発表会でした。
その期末発表会が行われた後、eSchoolの10周年イベントに参加しました。
諸先輩方と久しぶりの再会に感激しました。
向学心を持つ者同士の語り合いは、楽しいものでしたが、
予定があり、早々と切り上げてきました。
途中バケツをひっくり返したような雷雨に見舞われましたが、
幸いにもあまり濡れずに帰ってこられました。
ゼミに参加すると向学心に火が付きます。
日頃からゼミの学友と連絡を取ることが
より良いペースで進められるのではと思うに至りました。
さて夏休み、引越と論文に取りかかるぞよ!
2013年7月28日日曜日
2012年2月13日月曜日
寒真っ最中、美味しい食事と久しぶりの再会
2011年1月24日月曜日
卒論執筆と口頭試問の準備
いよいよ口頭諮問が再来週に迫ってきたのでこの書籍を参考に読んでみたいと思います。
ちなみに卒論を取り組んでいたときはバイブルとして以下の書籍も活用させていただきました。
以下のコメントはbooklogにレビューした内容です。
それと今後は、こちらの書籍を熟読する必要がありそうです。
以上、すべてBLUE BACKSシリーズです。
ちなみに卒論を取り組んでいたときはバイブルとして以下の書籍も活用させていただきました。
以下のコメントはbooklogにレビューした内容です。
著者のWebサイト「やればできる 卒業論文の書き方」http://www015.upp.so-net.ne.jp/notgeld/sotsuron.html よりも読みやすくまとめられている。今年卒論イヤーなので、ブックカバーに入れて、毎日持ち歩くことにした。
それと今後は、こちらの書籍を熟読する必要がありそうです。
以上、すべてBLUE BACKSシリーズです。
2011年1月4日火曜日
2011年の抱負
いままで新年の抱負といえば昨年できなかった事を翌年(新年)の目標に
引き続きねじ込んできた感があるが、
今年はまったく昨年できなかった事に執着せず(振り返らないわけではない)
が、新しい目標にしたいと思う。
ということで、2011年は人としての気づきについて意識的に行動
したいと思う。
気持ちを込めて
1) あいさつ
2) 感謝
3) 協調・共感
を行うこと。
コミュニケーションの年にしたいと思います。
引き続きねじ込んできた感があるが、
今年はまったく昨年できなかった事に執着せず(振り返らないわけではない)
が、新しい目標にしたいと思う。
ということで、2011年は人としての気づきについて意識的に行動
したいと思う。
気持ちを込めて
1) あいさつ
2) 感謝
3) 協調・共感
を行うこと。
コミュニケーションの年にしたいと思います。
2010年を振り返って
仕事面
仕事では新しいシステム導入にメンバーとして参画することができ
忙しくもやりがいのあるミッションを頂いた。(なおも進行中)
実務よりも人に教える事、つまるところ後釜に伝えていく為の
仕事には再考の余地があると感じた。
新しいことへ取り組む姿勢は性格上、不安面を考慮するより(悪く言うと予測できない)
壁に当たったときに一生懸命考える人間なんだと再確認できた。
そのことから、うまくいきそうもない事象予測のスキルはどのように磨けばよいのか、
知るきかっかけになったので思い起こしてみると良かったのかもしれない。
学生面
社会人学生になって、はや5年目。
卒論に取り組む年で一般科目を4年次までに取得したことで
卒論準備に時間を掛けることができた
が、準備する時間はいくらあっても足りないと感じた。
大雑把な性格の為かテーマの絞り込みに時間を要した故、
自分自身で感じたので周りからは200%以上そう感じたのではと反省。
卒論のテーマのおかげか刺激的な一年を過ごすことができたと実感した。
集団的知性という協調や共感
春以降になっても、この好奇心というかよく言えば向学心をキープして
さらなるスパイラルアップ系の流れを大事にしたい。
2010年1月2日土曜日
Hadoop Based Data Mining
Hw09 Hadoop Based Data Mining Platform For The Telecom Industry
感嘆のため息が漏れました・・・
中国語で読めないところがあったので院生に聞いてみたい。
感嘆のため息が漏れました・・・
中国語で読めないところがあったので院生に聞いてみたい。
2009年7月14日火曜日
Natural Language Processing
自然言語処理の基礎技術
・形態素解析
・・形態素解析(英語)
形態素とは語の不定形、語より小さい単位で意味を持つ最小の単位。文章の中で文法に従って形が定まっている語を”定形”と呼ぶ。文章はその語から成り立っている。語を、それを構成する形態素に分離する処理が形態素解析である。
・・形態素解析(日本語)
日本語は単語ではなく、文節が連なって文を構成しているので文節の形態素解析という。
日本語は膠着語という文法的分類に入れられる。
■コーパスからの語彙知識の獲得
1990年代までは、辞書の定義文や、人手による構文解析済みのコーパスが用いられていた。2000年代以降は言語取得の範囲拡大をし、新聞記事、Webから収集した言語テキストが用いられるようになった。
■共起知識の獲得
コーパス中の数単語程度の近さで共起する2つの単語の間の相互情報量を計算し、統計的な観点から意味のある言語現象を検出する。
■単語間の類似度の測定
「共起知識の獲得」の方法を発展させて、コーパスから主語/動詞/目的語の3項の組の類似性を測定し、相互情報量を類似度として計算した結果で、品詞の同義語を抽出する。
■推論規則・言い換えの獲得
同一の名詞を共起しやすい表現の類似度が高い多用な表現の共起の強さを相互情報量によって測定する。
■翻訳知識の獲得
相互情報量を用いた共起測定法において対訳テキストを情報源として二言語間の出現位置の相関が強いほど、その表現の組は対訳関係が強い可能性が高いといえる。
■未解析コーパス・Webからの獲得
WebのHTML言語からの箇条書きや表形式において、上位語、類義語、属性語が現れやすい。ヒューリスティックを利用して関連語を獲得する手法が提案されている。
■コーパスへの情報付与の自動化
nグラムモデルを用いた日本語形態素解析はある単語の生起のモデル化において、直前のn-1個の単語のみを考慮する培グラムモデルや直前の二単語のみを考慮するトライグラムモデルなどがある。
■意味的曖昧性解消
同意異義語の判別、訳語選択などの処理は分類器を用いて多義性をもつ語の前の文字列、形態素、係り受け関係にある形態素、同一文内の形態素、同一文書内の形態素などの情報が属性(素性)として用いられる。
■仮名漢字変換
仮名漢字変換は文節単位で行う。文節を形態素解析することにより文節内の単語の並び方が形態論的に正しい結果だけを用いることができる。またヒューリスティックな手法を適用することで多数の変換候補に対応できる。
■同音語
仮名漢字変換で最も大きな問題だが形態素解析を用いることで適切なものを区別することができ、自動選択することができる。
Data source from 自然言語処理(オーム社)
・形態素解析
・・形態素解析(英語)
形態素とは語の不定形、語より小さい単位で意味を持つ最小の単位。文章の中で文法に従って形が定まっている語を”定形”と呼ぶ。文章はその語から成り立っている。語を、それを構成する形態素に分離する処理が形態素解析である。
・・形態素解析(日本語)
日本語は単語ではなく、文節が連なって文を構成しているので文節の形態素解析という。
日本語は膠着語という文法的分類に入れられる。
■コーパスからの語彙知識の獲得
1990年代までは、辞書の定義文や、人手による構文解析済みのコーパスが用いられていた。2000年代以降は言語取得の範囲拡大をし、新聞記事、Webから収集した言語テキストが用いられるようになった。
■共起知識の獲得
コーパス中の数単語程度の近さで共起する2つの単語の間の相互情報量を計算し、統計的な観点から意味のある言語現象を検出する。
■単語間の類似度の測定
「共起知識の獲得」の方法を発展させて、コーパスから主語/動詞/目的語の3項の組の類似性を測定し、相互情報量を類似度として計算した結果で、品詞の同義語を抽出する。
■推論規則・言い換えの獲得
同一の名詞を共起しやすい表現の類似度が高い多用な表現の共起の強さを相互情報量によって測定する。
■翻訳知識の獲得
相互情報量を用いた共起測定法において対訳テキストを情報源として二言語間の出現位置の相関が強いほど、その表現の組は対訳関係が強い可能性が高いといえる。
■未解析コーパス・Webからの獲得
WebのHTML言語からの箇条書きや表形式において、上位語、類義語、属性語が現れやすい。ヒューリスティックを利用して関連語を獲得する手法が提案されている。
■コーパスへの情報付与の自動化
nグラムモデルを用いた日本語形態素解析はある単語の生起のモデル化において、直前のn-1個の単語のみを考慮する培グラムモデルや直前の二単語のみを考慮するトライグラムモデルなどがある。
■意味的曖昧性解消
同意異義語の判別、訳語選択などの処理は分類器を用いて多義性をもつ語の前の文字列、形態素、係り受け関係にある形態素、同一文内の形態素、同一文書内の形態素などの情報が属性(素性)として用いられる。
■仮名漢字変換
仮名漢字変換は文節単位で行う。文節を形態素解析することにより文節内の単語の並び方が形態論的に正しい結果だけを用いることができる。またヒューリスティックな手法を適用することで多数の変換候補に対応できる。
■同音語
仮名漢字変換で最も大きな問題だが形態素解析を用いることで適切なものを区別することができ、自動選択することができる。
Data source from 自然言語処理(オーム社)
2009年6月7日日曜日
2009年1月26日月曜日
2009年1月4日日曜日
2009年1月3日土曜日
登録:
投稿 (Atom)