SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年9月9日の週に気になった記事などまとめ

LangGraphを使ったReflection Agent: SNS投稿コンテンツ提案Agent

note.com

  • LLM-Based Agentの基本的なアーキテクチャであるReflection Agentを題材に、SNS投稿コンテンツを提案してくれるAgentを作成する方法を紹介した記事
  • コンテンツ生成するエージェントと別のエージェントに推論結果を批評させて、コンテンツを改善する

llm-jp-asr

github.com

  • Whisperのデコーダをllm-jp/llm-jp-1.3b-v1.0に置き換えた音声認識モデルを学習させるためのサンプルコード

Weekly AI Agents News!

speakerdeck.com

Large Language Model-Based Agents for Software Engineering: A Survey

www.arxiv.org

  • ソフトウェアエンジニア用のLLMベースのエージェントに関する包括的かつ体系的な調査を紹介する論文
  • 以下が調査のリポジトリ

私見Pythonプロジェクトの3類型(ver 2024.09)

nikkie-ftnext.hatenablog.com

AI-Driven Research Assistant

github.com

  • 複数のエージェントでデータ分析、可視化、レポート作成などのタスクを支援するアシスタントのリポジトリ

私のブックマーク「AIアライメント」

【記事更新】私のブックマーク「AIアライメント」 | 人工知能学会 (The Japanese Society for Artificial Intelligence)

論文翻訳検索

mt-auto-minhon-mlt.ucri.jgn-x.jp

  • NICTが公開している自動翻訳サイト
  • arXivPubMedの論文を検索できる

Tanuki-8BとOllamaとDifyを使って日本語ローカルRAG構築

zenn.dev

  • Tanuki-8Bを使って実用的なRAGシステムを気軽に構築する方法について解説した記事

カスタマーサポートのRAGに関する発想の転換について

note.com

  • ユーザーの入力の質が低いことがでもRAGの性能が向上しない
    • どのような質問をすれば企業の最適なデータを探し当てられるかを知っている人は少ない
  • RAGを使用して追加質問を生成するアプローチの紹介

突撃! 隣のAmazon Bedrockユーザー 〜YouはどうしてAWSで?〜

speakerdeck.com

  • 生成AIをAWSのビルディングブロックの一つとして活用できる

Jetson orin nano上のAgent StudioでTanuki-8Bを試す

note.com

GASとGeminiで実装する! 高精度議事録生成ツール

note.com

AIエージェントのビジネスインパクトとLangChain、LangGraphを使った実装例

zenn.dev

Tanuki-8B, 8x8B - 事後学習の軌跡

zenn.dev

RAGによる社内データ利活用〜社内FAQシステム編

note.com

  • 企業固有の情報に基づいた社内FAQシステムについて紹介した記事
  • 効果的な回答には以下が重要
    • 質問者情報
    • 背景・意図
    • 質問内容

Tanukiモデルが全角数字・記号を認識出来ない問題とその解決(LLM学習コーパスの正規化の落とし穴)

zenn.dev

フィードバックされやすい人になろう

speakerdeck.com

  • フィードバッグの見落としは大きな損失をもたらす
  • フィードバッグのしきいを下げることで気づきが増える

GraphRAG auto-tuning provides rapid adaptation to new domains

www.microsoft.com

  • GraphRAGが新しいドメインへ迅速へ適応できることが可能になったことを紹介する記事

自社開発した大規模言語モデルをどうプロダクションに乗せて運用していくか〜インフラ編〜

speakerdeck.com

RAGの精度と速度を同時に向上「DIVA」による曖昧さ対策

zenn.dev

  • 質問を複数の形に拡張して、検索の多様性を高める
  • 得られた情報の有用性を評価する

初心者でもできる!HuggingFaceモデルをGGUF形式に変換しOllamaで使う手順

uepon.hatenadiary.com

トークナイザー構築のナレッジとチームの取り組み紹介【Team Kuma】

zenn.dev

Tanuki-8B の GGUF 版トークナイザ―の調査

zenn.dev

「現場で実践!RAG活用術 Lunch LT ― 運用して分かった"つらみ"とその対策」で登壇してきました&質問の回答 #RAG_Findy

blog.studysapuri.jp

  • とにかく素早くフィードバッグサイクルを回すことが重要
  • 評価手法にこだわるよりは、改善を繰り返すほうが大事

rwkv-6-worldをColabで久しぶりに試してみる

bwgift.hatenadiary.jp

HuggingFace の speech-to-speech を試す

note.com

Integrating vision into RAG applications

techcommunity.microsoft.com

  • 画像を含む知識ベースに対応したRAGアプリケーションの統合について説明された記事

Gensparkの方が良いかも…?PerplexityAIとの違いを解説してみた

www.youtube.com

事業フェーズの変化に対応する 開発生産性向上のゼロイチ

speakerdeck.com

  • 変更のリードタイムの内訳をきちんと可視化し、ボトルネックを明確にする

PythonでPDFからテキスト/表情報の抽出精度を比較してみた

acro-engineer.hatenablog.com

  • PyMUPDF、pdfplumber,unstructuredの3つを比べた記事

OR学会2024秋_短期収益と将来のオフ方策評価性能を考慮したクーポン割当方策混合比の決定

speakerdeck.com

大規模言語モデルのバイアス

speakerdeck.com

Reader-LM: Small Language Models for Cleaning and Converting HTML to Markdown

jina.ai

  • Jina AIがノイズが多いHTMLをクリーンなMarkdown形式に変換する小規模言語モデルを公開した
  • CC BY0NC 4.0のライセンスで公開されている

JDLA勉強会 #13「LLM推論の課題と最適化技術」

www.youtube.com

抽象度の高い仕事の進め方

konifar-zatsu.hatenadiary.jp

  • 抽象度の高い仕事を任せられる人がどういう動きをしているかをまとめた記事
  • なぜやるかを明確にしている
  • 何をどこまでやるかを明確にしている
  • いつまでにやるかを明確にしている
  • 選択肢を出し提案して決めている
  • 自分から状況を共有・相談している

Mistral AI、初のマルチモーダルAIモデル「Pixtral」リリース 画像を理解

www.itmedia.co.jp

Can Large Language Models Unlock Novel Scientific Research Ideas?

arxiv.org

  • LLMの新しい科学研究のアイデアを生成する能力を評価した論文

「Difyソースコードリーディング#3 ―APIのリクエストからレスポンスまで」を開催しました #もくもくDify

blog.generative-agents.co.jp

HTMLから Markdown コンテンツへの変換に特化したJina Reader-LMを試す

note.com

  • ライセンスはCreative Commons Attribution Non Commercial 4.0で非営利利用に限定
  • 256Kトークンまで入力できる

各部署の生成AI活用能力を向上させる!「生成AIアンバサダー」の中間成果を公開

note.com

DataGemma: Using real-world data to address AI hallucinations

blog.google

  • 現実世界のデータを使ってハルシネーションに対処するために作成されたモデル

Google Colab で Pixtral-12B を試す

note.com

Introducing o1: OpenAI’s new reasoning model series for developers and enterprises on Azure

azure.microsoft.com

  • Azure OpenAI Serviceでも申請すれば、o1-preview、o1-miniを利用できる

OpenAI o1 System Card

openai.com

  • o1のシステムカード

OpenAI o1 の APIの使い方

note.com

  • 「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデル
  • 「reasoning tokens」を使用して、モデルは「think」プロセスを行い、プロンプトの理解を分解し、複数のアプローチを検討しながら応答を生成する
  • 推論トークン」を生成した後、モデルは最終的に可視の「補完トークン」(completion tokens) として答えを出力し、「推論トークン」はそのコンテキストから破棄される

OpenAI o1 の概要

note.com

OpenAI最新モデル!OpenAI o1-preview, o1-miniについて解説してみた

www.youtube.com

AWS Lambda Function URLsとAmazon API Gatewayの違い

serverless.co.jp

OpenAI o1はどう作るのか

note.com

従業員エンゲージメントを向上!良いリーダーになるための 4 つの方法

slack.com

  • フォロワーにもなれるリーダーが信頼される
  • 良いリーダーの情熱とポジティブさが従業員の成果につながる

Colabをローカル環境と接続する。

bwgift.hatenadiary.jp

DataGemma の概要

note.com

小さなWebブラウザを作ろう

browserbook.shift-js.info

「画像とLLM、 CVPR2024におけるLLMの動向」松尾研 LLM コミュニティ "Paper & Hacks Vol.18"

www.youtube.com

エンジニアと関係組織をつなぐ社内 DevRel のとりくみ

speakerdeck.com

トルコ生まれのタスク管理手法ビル・サイファで先送り癖が少しだけ改善した話

hagihara.hatenadiary.jp

たった1人からはじめる【Agile Community of Practice】

speakerdeck.com

スクフェス三河2024_自己組織的なチームから空虚なチームへ変貌させた3カ月の組織運営からの教訓

www.docswell.com

やってやろうじゃないかメカアジャイル

speakerdeck.com

インプットした情報をいい話だっただけで終わらせない!具現化するためにやったこと

speakerdeck.com

モノ売りからコト売りへ 製造業が向き合うビジネスとアジャイル

speakerdeck.com

グイグイ系QAマネージャーの仕事

speakerdeck.com

「人にやさしく」するということ

speakerdeck.com

必要なのは客観性。組織変革をもたらす、より良い「対話」を生み出すための活動

speakerdeck.com

Agile in Automotive Industry, puzzles and lights.

speakerdeck.com

生成AIを活用したテキスト分類/名寄せのアイデア【Databricks】

qiita.com

Build a Knowledge Graph-based Agent With Llama 3.1, NVIDIA NIM, and LangChain

medium.com

  • Llama3.1の関数呼び出し機能を用いて、ナレッジグラフから構造化データを取得し、RAGアプリケーションを強化する方法を紹介する記事

GenAI Agents: Comprehensive Repository for Development and Implementation

github.com

  • 生成AIの開発と実装のための包括的なリポジトリ
  • いくつかのエージェントの実装例が公開されている

langchain-autotools

github.com

  • PythonSDKからツールとツールキットを自動生成するためのライブラリ

大規模言語モデルLLMの論理的思考を強くするデータセットを考える①

note.com

OpenAI o1はどう作るのか(詳細編)

note.com

  翻译: