SOLプロジェクトはトゥイッグ・ファームのLETRチームです ニア そして マルチキャンパスこれは、優れた人工知能人材の育成を支援するために連携して機能するプログラムです。研修生が実践的なビジネスプロジェクトを体験し、LETRチームの研究開発文化を間近で体験する機会です。
昨年8月のプロジェクトの第1フェーズ以降、9人の将来の開発者がLETRチームに約3か月間在籍しています。実際のシーンをより身近に体験できるように、私たちは3つのグループに分かれてチームプロジェクトに取り組みました。また、メンターシップを通じて、ビジネスに関わるLETRのチーム研究者と交流したり協働したりする時間もありました。
少し前に終了した1回戦の参加者9人の話を聞きました。実際にプロジェクトに取り組んでいる間は、みんな違った感じだったと思います。彼はこの経験を通して学んだこと、考えたこと、感じたことについて、正直な話をしてくれました。
今回は、3回目の順番で、」オープンテキスト修正「このプロジェクトに参加したインターンの話を紹介します。また、まだではないかもしれません。」ナチュラル韓国語「と」冒涜とヘイトスピーチの分類「チームのインタビューをまだ見たことがないなら、一緒に読むことをお勧めします。
人工知能が最初の(?)なぜなら
ハロー自己紹介をお願いします!
ヨンフン: こんにちは、「フローティング・ライティング・コレクション」プロジェクトに参加したクォン・ヨンフンです。
テヨン: 私は 大学院で2年間コンピューターサイエンスを学び、その後3年間防衛分野の国家研究プロジェクトに参加しました。最初はマルチキャンパスのカリキュラムで自然言語処理と機械学習、ディープラーニングを学び、そのように実践することさえできました。以前はPythonを1年ほど使っていました。
ジュンホ: 学部では言語(中国文学)を専攻する一方で、コンバージェンスソフトウェア関連の専攻もダブルメジャーとして選びました。それ以来、アプリケーション開発コンテストへの参加など、さまざまな経験を通じて関連分野に参入する準備をしています。
なぜ人工知能、特に自然言語処理に興味を持ったのですか?
ヨンフン: 画像処理、自然言語処理、音声認識などの分野に関係なく、人工知能全般に非常に興味がありました。今回勉強を始めて自然言語処理にもっと興味を持つようになりました。
テヨン: 私はずっと人工知能の分野に行きたいと思っていましたが、自然言語処理コースを受講して興味が高まりました。
ジンホ: 私の専攻の性質上、古代文学から現代のエッセイまで、さまざまなスタイルのテキストに出会うことができました。その過程で、自分の意図や感情の表現方法には、思ったほど制約がないことに気づきました。その後、プログラミングを経験するうちに、人工知能の学習を通じて、人間味のある自然言語処理技術を開発したいという考えが浮かびました。
SOLプロジェクトを体験した後
SOLプロジェクトに応募したきっかけを教えてください。
ヨンフン: マルチキャンパスの自然言語処理カリキュラムで学んだことをどのように活用し、他の人がどのように活用しているのか、興味がありました。特に、人工知能を使った表示補正がどのような仕組みになっているのか、とても興味がありました。
テヨン: カリキュラムで学んだ理論が実際にどのように使われるのか興味がありました。結局、Twig FarmのCEOと2人の研究者が私のクラスのメンターで、会社に興味を持って応募しました。ビジネスにおける実践的なプロジェクトを経験する絶好の機会になると思い、応募しました。
ジュンホ: 複数のキャンパスで自然言語処理コースを勉強しているときに、募集のお知らせに出くわしました。私が実際に応募したのは、実際に言語の精錬や添削などの技術サービスを提供している場所で現場を体験し、実践的なプロジェクトに参加したいと思ったからです。
SOLプロジェクトでの経験はどうでしたか?
ヨンフン: スペーシングに関する先行研究論文のコードを探し、環境設定の修正、モデルトレーニング、データの前処理を担当しました。今回、BERTを使って環境を整え、学習結果を反映したデータを修正し、モデルを解析することで、外部モデルを使うことに自信がつきました。
テヨン: 目標は、専門用語以外で日常的に書かれている単語の間隔を修正できるライブラリを実装することでした。プロジェクトはチームメンバーとのミーティングを通じて実施され、毎週のチームレポートとメンタリングミーティングを通じて暫定的な進捗状況が確認されました。
そして、実際のプロセスは、具体的な目標、成果物の形態、そして大まかな進捗計画を設定することから始まりました。その後、文献研究を始め、スペース修正は韓国語に限った問題なので、韓国語で書かれた学術論文や雑誌記事をたくさん探しました。
論文を分析した後、実際に実装するライブラリコードを調べて参照モデルを決定し、コードが実際に正しく動作するかどうかを確認し、必要なデータを定義し、データに合ったモデルを学習してパフォーマンスを抽出するプロセスを経ました。
ジュンホ: このプロジェクトは、ケーススタディと以前の論文、ジャーナル、サービスの分析から始まり、応用データセットとライブラリの発見、パフォーマンス分析まで、約3か月にわたって実施されました。毎週火曜日には、メンタリングを通じてフィードバックを受け、研究の方向性を調整しました。金曜日には、チームメンバーと一緒に自分で中間調査を行いました。その後、私の毎週のルーチンは、月曜日に業績の中央値と進捗状況に関する週次レポートを書くことに戻りました。他のプレゼンテーションも、すべてのプロジェクトチームが集まった中間発表と最終発表の間に準備されました。
チームメンバーと一緒にプロジェクトに取り組んでみて、どんなことを感じましたか?
ヨンフン: プロジェクトレポートの書き方とプレゼンテーションの仕方を学びました。本当に助かりました!
テヨン: プロジェクトが方向性を失わないようにするには、まず全体像を描くことから始めなければならないことを学びました。そのためには、プロジェクトの目標、成果物、計画、タイムラインが明確でなければなりません。今までは、目の前で仕事を終わらせようと急いでいたので、方向から外れることが多かったです。
しかし今回は、チームメンバーとの話し合いを通じて、考えたり決めたりする過程で理解を深めることができました。今やっていることを理解して実行すれば、後になって無駄な時間の無駄を減らすことができます。
最後に、何をするにしても、常に考え、率先して仕事に取り組むことを約束しました。
ジュンホ: 比較的経験豊富な大学院卒業生から高校を卒業した友人まで、さまざまなバックグラウンドを持つチームメンバーが「間隔補正」チームに加わりました。私は年齢や経験という点では中途半端な立場なので、知らなかったことを学び、逆に知っていることを共有できたと思います。そのおかげで、固定された役割から離れ、さまざまな視点から解決策を考える貴重な経験をすることができました。
プロジェクトを終えたとき、最も印象に残っていることは何ですか?
ヨンフン: プロジェクトが完了した後も連絡を取り合う関係を築きました。今準備していることや進んでいることを分かち合い、お互いに応援し合っている良い人たちが残っていました。
テヨン: この日、最終発表が行われました。コロナウイルスの影響でオンラインで知り合った人たちや、メンターのみんなに直接会うことができました。また、社長はいつも私にポジティブなフィードバックや良いコメントをたくさんくれたことを覚えています(おそらく彼がインターンだったことを考えると)。
ジュンホ: プロジェクトの成果を発表し終わり、最終報告書を書きながら過去の期間を振り返った時が一番記憶に残っています。今までは週間目標に力を入れていたので、小さなことにも頑張っていましたが、最後に全体の文脈が見えてきたとき、以前とは違う気持ちになりました。
SOLプロジェクトとその先
どんな分野に挑戦したいか、将来達成したい目標は何か?
ヨンフン: 小さな問題でも、自分の問題を解決するのに役立つテクノロジーに興味があると思います。また、そのような技術は単に技術力を伸ばすだけでは開発できないと思います。そこでプロジェクトを終えて、Web開発と人工知能を組み合わせて、人々が抱えるさまざまな問題を解決したいというアイディアが浮かびました。
今では多くの人が興味を持ち、一緒に開発できる技術を扱う機械学習ウェブ開発者になることを夢見ています。
テヨン: 自然言語処理にはたくさんの分野があるので、今後はもっと多様なことを経験したいと思っています。特に、何をするにしても、一番大事なのは学習に使うデータだと思いますし、将来、このようなデータを扱う機会があったらいい経験になると思います。
なによりも、何をするにしても、飽きることなく、興味を失わず、常に周囲からの変化やアドバイスを受け入れる人になりたいです。
ジュンホ: 目標は、感情分析調査を通じて、質問に含まれる意図まで特定できるサービスを開発することでした。顔の表情に基づいて感情を分析する画像ベースのサービスは、AIインタビューやフォレンジックなどの分野ですでに商品化されています。近いうちに、簡単な言葉や文章でも人気と専門性の両方を満たすことができるユニバーサルサービスを開発できると信じています。
最後に、今後プロジェクトを経験する後輩たちにメッセージをお願いします。
ヨンフン: 自分で頑張れば、とても助かります。宇宙関連のプロジェクトに取り組んでいるなら、私たちのリポジトリをチェックしてください!
テヨン:(毎日綿密な管理を受けるわけではありませんが、実際の仕事を直接体験して、現場がどんな場所なのかを感じることができます。視野を広げる絶好の機会なので、ぜひ試してみてください!
ジュンホ: 今回、言語分析データセットやオープンライブラリは思ったより多様であることを知りました。明確なトピック設定とプロジェクト管理が伴わなければ、無駄な試行錯誤の可能性が高まるに違いありません。そういう意味では、SOLプロジェクトは専門的なメンタリングやインフラを受ける絶好の機会なので、みんなが有意義な成果を出すためにうまく活用できたらいいなと思っています。
仕上げ中
SOLプロジェクトのインターン生は、この3か月間、誰よりも激しい時間を過ごしました。そんな忙しいスケジュールの中、レポートを書いたり、オープンソースをリリースしたり、成果を共有するためのデモサイトを作ったりしました。
3つのSOLプロジェクトチームの成果を以下に示します。皆様のご関心とご支援をお願いします。
SOLプロジェクトのインターン生は皆、3か月間素晴らしい時間を過ごしました。すぐにお会いしましょう!
ナチュラル韓国語
https://github.com/twigfarm/letr-sol-koFISH
虐待的なヘイトスピーチの分類
https://github.com/twigfarm/letr-sol-profanity-filter
https://huggingface.co/dobbytk/KSL-BERT
間隔補正
https://github.com/twigfarm/letr-sol-spacing
一緒に見るのに良いコンテンツ
言語処理エンジンであるLETRがテキスト言語に焦点を当てているのはなぜですか?未来のAI開発者の種をまく、SOLプロジェクトインターンインタビュー1未来のAI開発者の種をまく、SOLプロジェクトインターンインタビュー2