Databricks 「データ レイクハウス、統合によるイノベーション」


Lakehouse、統合されたガバナンス、データの 1 つのコピーで生産性を向上

本日25日、Databricksは毎年恒例のグローバルイベント「Data + AI World Tour」を韓国で初めてオフラインで成功裏に開催した。

「Destination Lakehouse」というテーマで開催されるデータ + AI ワールド ツアーでは、最新化されたデータ スタックを構成する主要な要素と、企業がデータ資産をすぐに使用してより効果的な意思決定を行えるようにする主要な要素に焦点を当てます。 AI の実装に成功します。 データ レイクハウスに焦点を当てます。

Databricks Data Lakehouse は、データ レイクの柔軟性、費用対効果、スケーラビリティをデータ ウェアハウスのデータ管理機能と組み合わせて、すべてのデータのビジネス インテリジェンス (BI) と機械学習を可能にする、オープンで統合されたデータ プラットフォームです。

このイベントには、国内のデータと AI の専門家が参加し、洞察とベスト プラクティスを共有しました。 Gmarket、Emart24、Devsisters、Hanwha、Mezzomedia、Job Korea、Finda、Weverse Company、Musinsa などの主要な国内企業のデータおよび AI リーダーが、講演者と同様にデータ イノベーションの旅を共有しました。

これに伴い、Databricks社のオープンソースAIモデル「Dolly」の新バージョン「Dolly 2.0」がリリースされ、注目を集めました。 Dolly 2.0 は、研究用または商用利用可能なコマンド学習データセットを構築することによって実装された、オープンソースの大規模言語モデル (LLM) です。 Databricks は、IllutherAI の Pythia モデル ファミリーに基づく 120 億パラメーターの言語モデルを使用して、スタッフによってクラウドソーシングされた高品質のコマンド フォローイング データセットを構築しました。

Databricks は、トレーニング コード、データセット、ドリー モデルのトレーニング済みの重みなど、ドリー 2.0 のすべてのオープン ソース要素を商用利用のために提供します。 これにより、組織は、API アクセスに料金を支払ったり、サードパーティとデータを共有したりすることなく、人々と通信できる LLM を構築、所有、およびカスタマイズできます。

Databricks のブランチ マネージャーであるチャン ジョンウク氏は、歓迎の挨拶で次のように述べています。変更するには、技術的な側面に加えて、組織と人材の準備が重要です」と彼は言いました。

チャン・ジョンウク支店長は「Databricksはレイクエンタープライズです。より多くの企業と共にAIとデータエコシステムのオープンな基盤を形成しています。多くの国内外の企業が私たちの可能性を認め、共に成長しています」と語った。数十の組織が当社のプラットフォームを活用していることがその証拠です。 データ要件を満たすために、低コストで迅速なイノベーションで企業をサポートします。」

Databricks Asia Pacific のシニア バイス プレジデントである Ed Renta 氏は基調講演で、「すべての企業はデータ駆動型のアプローチに移行するでしょう。つまり、すべてのドメインで統一された AI とデータ駆動型の意思決定を行うことになります。ほとんどの企業は AI 機能を拡張します。ビジネス価値を提供するために 「創造することが重要です。 今日の企業は、データドリブンな企業になろうとしています。」

「データと AI の成熟度は、反応型から予測型および自動化された意思決定へと移行しています。過去 10 年間、私たちはデータの問題の解決に取り組み、私たちのビジョンを顧客に伝える方法を考えてきました。その結果、オーストラリア、シンガポール、香港、日本、韓国に進出し、前年比で 90% の成長と 80% の人員拡大を達成し、アジア太平洋地域全体で 600 人以上の専門家が技術サポートを提供しています。 “

2 番目の基調講演を行った Databricks Global Fields の CTO である Chris Diagostino 氏は、次のように述べています。など、多くの時間とお金を投資します。」

「この観点から Lakehouse を構築することが重要です。これは iPhone のルック アンド フィールに似ています。複数の電子デバイスの機能が 1 つの環境で提供されます。Lakehouse プラットフォームは統合されたガバナンス、データの 1 つのコピーを備えています。オーケストレーション、データ サイエンスと機械学習、ガバナンス、データ ウェアハウス、ストリーミング、BI が可能になります。」

クライアント企業として基調講演に出席した Emart24 の CIO である Jaekyung Lee 氏は、次のように述べています。サービス、そして最終的にデータ文化の構築.過去には、複雑さとチームメイトとの連携方法に問題があったと彼は言いました.

彼は続けて、「私たちはAI製品レコメンデーションサービスを開発しました。店舗に推奨されるこのサービスは、Databricksプラットフォームを使用してデータとアルゴリズムを最適化し、コンピューティングリソースを最適化します。分析時間は1時間、分析リソースのコストは70,000ウォンです。将来的には、商品企画、物流、マーケティング、店舗販売管理、店舗開発などの分野で Databricks プラットフォームを使用する予定です。」

「エンタープライズ データ統合によるデータ価値の最大化」についてプレゼンテーションを行うハンファ DT ストラテジー チームのテック リードである Giseon Han 氏は、次のように述べています。グローバルな市場環境の変化を踏まえ、機械学習の分野で製品価格と株価予測を拡大することを検討しています。」

3回目の発表を担当したDevsistersのCTOであるSeongjin Hong氏は、「ゲームの性質上、多くのユーザーとトラフィックがあります。定期的な新しいリリース、不十分なデータ体験、ローンチ後の急速なデータ増加に悩まされてきました。 ”

「Databricks は、SQL や Python などのさまざまなコンピューティング言語を含め、すべての人に生産性の高いプラットフォームを提供してきました。データ マイニングと分析のエクスペリエンスも向上しました。そのため、データ レイクをLakehouse SQLベースのワークフローは生産性を高め、さまざまなデータエンジニアがプロジェクトに貢献できる構造に変わりました。

一方、この日は「2023 Korea Data + AI Awards」も開催され、データと AI を使用して業務を革新した各組織のデータ チームを選出しました。 合計 5 つの Databricks カスタマー チームが賞を受賞しました。 Weverse Company は Data + AI Transformation Award 部門を受賞し、Devsisters は Data + AI Visionary Award 部門を受賞しました。 続いて、ムシンサはデータ+AI民主化賞、Emart24のCIOであるイ・ジェギョン、データ+AIエグゼクティブ賞、Gmarketのプラットフォーム技術マネージャーであるソ・デホン、データ+AIチャンピオン賞を受賞しました。

「データ レイク ハウスのパイオニアとして、私たちはデータと AI を誰もが利用できるようにすることに注力しています。 このイベントは、国内のデータおよび AI 業界のリーダーが洞察とベスト プラクティスを共有し、Databricks 製品のイノベーション トレンドを直接観察するための非常に教育的な場所です。

「特に、このイベントで初めて Databricks Korea Customer Awards を開催し、次世代のイノベーションを推進する全国のデータおよび AI チームと、業界のビジョンを提示するリーダーの貢献を称賛することは重要です。」

ハローティのソ・ジェチャン記者 |

Toyama Jiro

「テレビオタク。情熱的な料理のスペシャリスト。旅行の専門家。ウェブの第一人者。筋金入りのゾンビ好き。謝罪のない音楽狂信者。」