Data Lake Insight (DLI)

ความง่ายในการใช้งาน

ผลลัพธ์สำหรับข้อมูลระดับ TB สามารถส่งคืนได้ภายในไม่กี่วินาที การพัฒนานั้นง่ายดายด้วยการใช้ Structured Query Language (SQL) มาตรฐาน และการดำเนินการที่ไม่ต้องบำรุงรักษา หมายความว่ามีการลงทุนแรงงานน้อย

การวิเคราะห์แบบเบ็ดเสร็จ

ผสมผสาน Spark, Flink และ Trino เพื่อมอบประสบการณ์การวิเคราะห์เชิงโต้ตอบที่ราบรื่นสำหรับการประมวลผลข้อมูลทั้งแบบแบตช์และแบบสตรีม

ความคุ้มค่าคุ้มราคาที่เหนือกว่า

สถาปัตยกรรมการจัดเก็บและการคำนวณที่แยกจากกันทำให้ต้นทุนลดลง ทรัพยากรยืดหยุ่น การนำกลับมาใช้ใหม่ตามเวลา และลำดับความสำคัญที่ยืดหยุ่น

โอเพนซอร์ส

ความสามารถในการวิเคราะห์แบบครอสซอร์สทำได้โดยสนับสนุนรูปแบบข้อมูลโอเพนซอร์สยอดนิยมและผสานการทำงานกับผลิตภัณฑ์ BI หลัก

เหตุใดจึงควรเลือก Huawei Cloud DLI

ทั้งหมดใน SQL

ทั้งหมดใน SQL

  • ด้วยกลไกหลายโมเดล DLI ทำให้การวิเคราะห์ข้อมูลขนาดใหญ่สามารถเข้าถึงได้สำหรับผู้ที่ไม่มีพื้นฐานเกี่ยวกับข้อมูลขนาดใหญ่ ขอเพียงแค่คุณมีความรู้ด้าน SQL เข้ากันได้อย่างสมบูรณ์กับระบบนิเวศและอินเทอร์เฟซ Apache Spark, Apache Flink และ Trino และสามารถย้ายแอปพลิเคชันออฟไลน์ไปยังคลาวด์ได้อย่างง่ายดาย ทรัพยากรชุดหนึ่งสามารถจัดการการคำนวณหลายประเภท รวมถึงการประมวลผลสตรีม การประมวลผลแบบแบตช์ และการวิเคราะห์เชิงโต้ตอบ

กลุ่มทรัพยากรที่ความยืดหยุ่น

กลุ่มทรัพยากรที่ความยืดหยุ่น

  • กลุ่มทรัพยากรมีความยืดหยุ่นและสามารถปรับเปลี่ยนตามความต้องการที่ผันผวนของทรัพยากรแบบออฟไลน์ แบบเรียลไทม์ และแบบโต้ตอบได้อย่างรวดเร็ว นอกจากนี้ยังสนับสนุนลำดับความสำคัญระดับงานและผสานการทำงานกับ DataArts Studio เพื่อการดำเนินการที่มีประสิทธิภาพเพื่อให้แน่ใจว่างานที่สำคัญจะเสร็จสิ้นตรงเวลา

Lakehouse

Lakehouse

  • DLI ผสมผสานรูปแบบที่จัดเก็บข้อมูลดิบ Hudi สำหรับการวิเคราะห์และรองรับโซลูชันแบบรวมสำหรับเครื่องยนต์หลายตัว เช่น Spark และ Flink นอกจากนี้ยังช่วยให้รวบรวมข้อมูลแบบเรียลไทม์และวิเคราะห์ข้อมูลเชิงพื้นที่โดยใช้ SQL ได้อีกด้วย

การวิเคราะห์ข้ามแหล่งที่มา

การวิเคราะห์ข้ามแหล่งที่มา

  • DLI รองรับรูปแบบข้อมูลหลายรูปแบบและสามารถวิเคราะห์ข้อมูลจากแหล่งต่าง ๆ เช่น คลาวด์ ฐานข้อมูลภายในองค์กร และฐานข้อมูลออฟไลน์ โดยไม่จำเป็นต้องย้ายข้อมูล สิ่งนี้ช่วยให้สร้างมุมมองรวมของข้อมูลองค์กร ช่วยให้ธุรกิจสามารถสร้างสรรค์นวัตกรรมและปลดล็อกคุณค่าของข้อมูลได้อย่างรวดเร็ว

ข้อมูลเชิงลึกอันมีค่าสำหรับทุกสถานการณ์

การวิเคราะห์ฐานข้อมูล
การวิเคราะห์ฐานข้อมูล

วิเคราะห์ข้อมูลที่เก็บไว้ในฐานข้อมูลเชิงสัมพันธ์ เช่น ข้อมูลการลงทะเบียนสำหรับแอปพลิเคชัน

ข้อดี
ประสบการณ์ SQL ที่คุ้นเคย

ไวยากรณ์ SQL ของ DLI เข้ากันได้อย่างสมบูรณ์กับมาตรฐาน ANSI SQL 2003 สำหรับฐานข้อมูลเชิงสัมพันธ์ ไม่ต้องเรียนรู้เพิ่มเติม และช่วยให้คุณใช้ SQL ได้ตามปกติ

ประสิทธิภาพที่เหนือกว่า

DLI ใช้รูปแบบการประมวลผลแบบกระจายในหน่วยความจำเพื่อจัดการข้อมูลจำนวนมหาศาลได้อย่างง่ายดาย

ปัญหาคอขวดได้รับการแก้ไขแล้ว
ฐานข้อมูลเชิงสัมพันธ์ไม่สามารถจัดการกับแบบสอบถามที่ซับซ้อนได้เมื่อปริมาณข้อมูลเพิ่มมากขึ้น
การชาร์ดอาจขัดขวางการวิเคราะห์โดยละเอียด
การวิเคราะห์ข้อมูลทางธุรกิจสามารถส่งผลกระทบต่อการดำเนินการออนไลน์ได้
บริการที่เกี่ยวข้อง
อีคอมเมิร์ซ
การตลาดที่แม่นยำ

ในอุตสาหกรรมอีคอมเมิร์ซ การได้รับข้อมูลจากแหล่งต่าง ๆ ถือเป็นสิ่งสำคัญสำหรับการวิเคราะห์สหสัมพันธ์ เพื่อเพิ่มประสิทธิภาพการตลาดที่แม่นยำและปรับปรุงอัตราคอนเวอร์ชัน ตัวอย่างเช่น การเชื่อมโยง “ข้อมูลกิจกรรมการคลิกโฆษณาในหน้า” กับ “ข้อมูลการลงทะเบียนผู้ใช้” เพื่อระบุประเภทโฆษณาที่กลุ่มอายุต่าง ๆ ชอบ และนำเสนอโฆษณาที่แม่นยำยิ่งขึ้นแก่ผู้ใช้ตามอายุของพวกเขา

ข้อดี
การวิเคราะห์ข้ามแหล่งที่มา

ข้อมูลสามารถเชื่อมโยงและวิเคราะห์ได้ระหว่าง “ข้อมูลกิจกรรมการคลิกโฆษณาในหน้า” ที่เก็บไว้ใน OBS และ “ข้อมูลการลงทะเบียนผู้ใช้” ที่เก็บไว้ใน Relational Database Service (RDS) โดยไม่จำเป็นต้องย้ายข้อมูล

การดำเนินการ SQL อย่างแท้จริง

DLI ได้รวมแหล่งข้อมูลหลายแหล่งเข้าด้วยกัน และการแมปแหล่งข้อมูลสามารถทำเสร็จสมบูรณ์ได้โดยตรงผ่านการสร้างตาราง SQL

บริการที่เกี่ยวข้อง
การเล่นเกม
การวิเคราะห์บันทึก

บริษัทเกมพึ่งพาแพลตฟอร์มการวิเคราะห์ข้อมูลเพื่อเอาชนะความท้าทายในอุตสาหกรรมโดยใช้ประโยชน์จากพลังของข้อมูล ตัวอย่างเช่น การค้นหาช่องทางโฆษณาที่มีคุณภาพสูง การปรับปรุงการรักษาผู้เล่นใหม่ การเพิ่มประสิทธิภาพกิจกรรมการดำเนินงานเพื่อเพิ่มกิจกรรมของผู้เล่น และการขับเคลื่อนการทำซ้ำผลิตภัณฑ์ผ่านข้อมูล

ข้อดี
เรียกเก็บตามการใช้

DLI จะเรียกเก็บเงินเฉพาะในช่วงที่ใช้งานเท่านั้น ซึ่งช่วยลดต้นทุนได้มากกว่า 50% เมื่อเปรียบเทียบกับคลัสเตอร์พิเศษ

การวิเคราะห์แบบบรรจบกัน

เอนจินทั้งสามของ DLI จะแบ่งปันข้อมูลเมตาร่วมกัน และข้อมูลจะถูกทำล้างแบบเรียลไทม์ก่อนที่จะถูกจัดเก็บสำหรับการประมวลผลดึง แปลง และโหลด (ETL) แบบออฟไลน์ ผลการประมวลผลสามารถนำไปใช้สำหรับการวิเคราะห์เชิงโต้ตอบและการสำรวจข้อมูลโดยตรง

แก้ไขปัญหาคอขวดแล้ว
การวิเคราะห์บันทึกโดยปกติจะกำหนดตารางเวลาเป็นช่วง ๆ ส่งผลให้มีเวลาว่างมากระหว่างการกำหนดตารางเวลาแต่ละครั้ง
บริการที่เกี่ยวข้อง
องค์กรขนาดใหญ่
การวิเคราะห์บันทึก

องค์กรขนาดใหญ่หลายแห่งมักจะมีแผนกต่าง ๆ ที่ใช้บริการคลาวด์ ซึ่งต้องมีการจัดการสิทธิ์ให้กับพนักงานต่าง ๆ ในแต่ละแผนก ซึ่งรวมถึงการดูแลการสร้าง การลบ การใช้ และการแยกทรัพยากรการประมวลผล ในเวลาเดียวกันพวกเขายังต้องจัดการข้อมูลของแต่ละแผนกอีกด้วย โดยให้แน่ใจว่ามีการใช้โปรโตคอลการแยกและแบ่งปันที่เหมาะสม

ข้อดี
การควบคุมสิทธิ์แบบละเอียด

การควบคุมการอนุญาตในระดับคอลัมน์ การควบคุมการอนุญาตแบบแยกสำหรับ INSERT INTO/OVERWRITE การควบคุมการอนุญาตแบบอ่านอย่างเดียวสำหรับข้อมูลเมตาของตาราง

การจัดการแบบรวมศูนย์

ใช้ Identity and Access Management (IAM) เพื่อจัดการผู้ใช้ (ไม่จำเป็นต้องสร้างผู้ใช้ DLI แยกต่างหาก) และรองรับการอนุญาตแบบละเอียดผ่าน IAM

บริการที่เกี่ยวข้อง
พันธุศาสตร์
การจัดการข้อมูลทางพันธุกรรม

ในสาขาพันธุศาสตร์ มีไลบรารีการวิเคราะห์ของบุคคลที่สามมากมายที่ใช้กรอบงานแบบกระจาย Spark เช่น ADAM และ Hail

ข้อดี
รองรับอิมเมจที่กำหนดเอง

คุณสามารถแพ็คเกจไลบรารีการวิเคราะห์ของบุคคลที่สาม เช่น ADAM และ Hail ตามภาพพื้นฐาน ซึ่งสามารถอัปโหลดไปยัง SWR ได้โดยตรง เมื่อรันงานบน DLI รูปภาพที่กำหนดเองใน SWR จะถูกดึงโดยอัตโนมัติ

อิมเมจพื้นฐานในตัว

เวอร์ชันปรับปรุงของ Spark/Flink ในตัวของ Huawei และอิมเมจ AI โอเพนซอร์สสำหรับ TensorFlow, Keras และ PyTorch

บริการที่เกี่ยวข้อง
การเงิน
การควบคุมความเสี่ยงแบบเรียลไทม์

เพื่อเพิ่มโอกาสในการขจัดหรือลดการเกิดเหตุการณ์ความเสี่ยง จำเป็นต้องมีระบบควบคุมความเสี่ยงสำหรับสถานการณ์ทั่วไป เช่น การลงทะเบียน การเข้าสู่ระบบ และการควบคุมธุรกรรม

ข้อดี
อัตราความเร็วสูงและความหน่วงต่ำ

การใช้โมเดล Dataflow ของ Apache Flink ทำให้เป็นกรอบงานการประมวลผลแบบเรียลไทม์เต็มรูปแบบ ระบบจะใช้ทรัพยากรการประมวลผลประสิทธิภาพสูงและสามารถประมวลผลข้อความได้ 1,000 ถึง 20,000 ข้อความต่อวินาทีต่อหน่วยประมวลผลกลาง (CPU)

ระบบนิเวศคลาวด์ที่ครบครัน

การใช้ SQL สามารถเขียนสตรีมข้อมูลที่ประมวลผลแล้วลงในบริการคลาวด์ต่าง ๆ เช่น CloudTable และ SMN ได้

บริการที่เกี่ยวข้อง
รัฐบาล
หน้าจอใหญ่แบบเรียลไทม์

เพื่อบริหารจัดการการระบาดใหญ่ของ COVID-19 ได้ดีขึ้น รัฐบาลจำเป็นต้องใช้แดชบอร์ดแบบเรียลไทม์เพื่อตรวจสอบข้อมูลสำคัญ เช่น จำนวนผู้ป่วยที่ได้รับการยืนยันในปัจจุบัน จำนวนผู้ป่วยที่ได้รับการยืนยันสะสม และผู้ป่วยที่นำเข้าจากต่างประเทศ ซึ่งเป็นการสนับสนุนข้อมูลสำหรับการควบคุมการระบาดใหญ่ขั้นต่อไป

ข้อดี
ประสิทธิภาพการค้นหาในระดับมิลลิวินาที

กลไก openLooKeng ในตัวใช้เทคนิคการเพิ่มประสิทธิภาพการค้นหามากมายเพื่อตอบสนองความต้องการการวิเคราะห์เชิงโต้ตอบระดับมิลลิวินาทีที่มีประสิทธิภาพสูงบนเฟรมเวิร์กการประมวลผลภายในหน่วยความจำ

ใช้งานง่าย

วิธีการพัฒนา SQL อย่างแท้จริงที่มีความเข้ากันได้อย่างสมบูรณ์กับไวยากรณ์ ANSI SQL 2003 มาตรฐาน

บริการที่เกี่ยวข้อง

นวัตกรรมบริการอย่างต่อเนื่องสำหรับลูกค้านับหมื่นราย

นวัตกรรมบริการอย่างต่อเนื่องสำหรับลูกค้านับหมื่นราย

เริ่มต้นการเดินทางของคุณ
เพื่อ

รับข้อมูลเชิงลึกอันมีค่า

ทันที
ลองเลย

บริการอื่น ๆ

บริการอื่น ๆ