วันจันทร์ที่ 24 มกราคม พ.ศ. 2554

Week9 : Data Management II & Business Intelligence

Data Management II & Business Intelligence

Date warehouse คือ สถานที่จัดเก็บข้อมูลอยู่ในระบบ database มีประโยชน์ คือ
  - เข้าถึงข้อมูลได้เร็ว เนื่องจากข้อมูลอยู่แหล่งเดียวกัน
  - เข้าถึงข้อมูลได้ง่าย เนื่องจากฐานข้อมูลอยู่บน Web browser

ลักษณะของ Data warehouse
  1.Organization มีการกรองข้อมูลจากแหล่งต่างๆ รวมเข้าในระบบเดียวกัน ซึ่งเรียกว่า Data warehouse แบ่งข้อมูลตามหัวข้อ
  2.Consistency เป็นการกรองข้อมูลให้มีรูปแบบตรงกัน ป้องกันข้อมูลซ้ำซ้อน และผิดพลาดในการนำไปใช้
Data Warehouse Processing มีขึ้นตอนต่างๆดังต่อไปนี้
          1. รวบรวมข้อมูล  - Collecting data from internal and external
          2. จัดทำ Meta Dataเป็นข้อมูลที่ใช้อธิบายข้อมูลที่อยู่ใน data warehouse เช่น ที่มาของข้อมูล เป็นต้น
          3. Data Staging  (ECTL or ETL)ซึ่งประกอบไปด้วยการทำ Extract, Clean, Transform และLoad  คือการดึงข้อมูลออกมาตาม Attribute ที่มีประโยชน์ และเกี่ยวข้องกับการตัดสินใจ และจะทำการClean ข้อมูล โดยจะตัดข้อมูลที่ไม่เป็นประโยชน์ออกและจัดข้อมูลใหม่ให้อยู่ใน Format ที่เป็นมาตรฐานและสุดท้ายจะทำการ Load ข้อมูลเข้าไปยัง Data Cube ซึ่งจะประกอบไปด้วยหลายๆ Dimension และใช้สำหรับการวิเคราะห์เพื่อตัดสินใจเชิงกลยุทธ์ต่อไป
          4. สร้าง Data Warehouse  นำข้อมูล Data Cube ไปสร้าง Data Warehouse โดยจะมีการนำเสนอซึ่งยึด Business View เป็นหลักซึ่งการนำเสนอข้อมูลจะอยู่ในรูปแบบที่ง่ายต่อการวิเคราะห์ ตลอดจนสามารถ ปรับใช้งานได้ง่าย ส่วนใหญ่ในรูปDashboard

ประโยชน์ที่สำคัญของ Data Warehouse
1.      เข้าถึงข้อมูลได้รวดเร็วเนื่องจากมีข้อมูลที่จัดเรียงแล้วรวมกันอยู่ที่เดียว ซึ่งสามารถเข้าใช้ผ่านช่องทางต่างๆได้ ไม่ว่าจะเป็น VPN Web browser  LAN เป็นต้น
2.      ลดความซ้ำซ้อนของข้อมูล ทำให้สะดวกรวดเร็วในการค้นหาข้อมูลต่างๆ ทำให้องค์กรได้เปรียบเชิงแข่งขัน

Data Mart
         Data Warehouse ขนาดเล็กของแต่ละแผนก เพื่อให้เกิดความสะดวกสบายในการใช้งานของแต่ละแผนก โดย แบ่งออกเป็น 2 ประเภท คือ
          1.Replicated (Dependent) Data Mart 
          2.Stand-alone Data Mart 
Data Cube
          เป็น Multidimensional Databases ช่วยให้ผู้ใช้เห็นข้อมูลเหล่านั้น ในหลายๆมิติ ทำให้มีประสิทธิภาพในการนำไปใช้มากยิ่งขึ้น 

Business Intelligence
  Business Intelligence(BI) คือ กระบวนการรวมโครงสร้างระบบ เครื่องมือ ฐานข้อมูลและ application ต่างๆ ซึ่งช่วยในการวิเคราะห์ข้อมูลให้มีประสิทธิภาพ มี 3 องค์ประกอบ ดังนี้
  1. Reporting and analysis เป็นการรายงานข้อมูล มี 3 รูปแบบ
      - Enterprise Reporting System เป็นรายงานรูปแบบปกติและสามารถแก้ไขได้ เหมาะกับผู้บริหารในการนำไปวิเคราะห์
      - Dashboards เป็นการรายงานข้อมูลของ Visual displays แบ่งเป็น 3 ระดับ ได้แก่ operation dashboard, Tactical Dashboard และ Strategic dashboard
      - Scorecard เป็นรายงานสำหรับผู้บริหาร ผู้จัดการระดับ Strategy ซึ่งเป็นการนำหลักการของ Balance Scorecard และมีการกำหนด KPIs เพื่อประเมินผลและตรวจสอบ
  2. Analytic การนำเครื่องมือต่างๆมาใช้วิเคราะห์ข้อมูล เช่น Business Performance (BPM)
  3. Data mining เป็นการค้นหาข้อมูลในอดีตมาใช้หรือเป็นการแยกข้อมูลเพื่อพยากรณ์แนวโน้มในอนาคตมีทั้งหมด 5 รูปแบบ ได้แก่
      - Clustering ข้อมูลมีความสัมพันธ์กันเอง
      - Classification ข้อมูลตามสมมติฐานและทดสองว่าจริงหรือไม่
      - Association ข้อมูลที่เกิดจากการวิเคราะห์
      - Sequence discovery ผลที่ตามมา
      - Prediction ข้อมูลที่ไว้คาดการณ์ในอนาคต

รูปแบบของ Data Mining มีทั้งหมด 5 รูปแบบ ดังต่อไปนี้
1.Clustering - นำเสนอข้อมูลที่มีความสัมพันธ์กันเอง โดยไม่มีการตั้งสมมติฐานไว้ล่วงหน้า(ไม่รู้ว่าจะเกิดอะไรขึ้น)
2.Classification - นำเสนอข้อมูลตามสมมติฐานที่เราคิด โดยให้ทดสอบว่าสมมติฐานนั้นจริงหรือไม่ อย่างไร
3.Association - นำเสนอผลสืบเนื่อง เช่น คนที่เปิดบัญชีประเภทออมทรัพย์จะมีกี่ % ที่ใช้บัตร ATM
4.Sequence discovery - consequence  ผลที่เกิดตามหลังมา
5.Prediction – นำเสนอโดยการพยากรณ์สิ่งที่จะเกิดขึ้นในอนาคต
ข้อดีและข้อเสียของ Data Mining
เป็นเครื่องมือที่ใช้งานง่ายสำหรับพนักงานระดับปฏิบัติการ
แต่เทคนิคอาจมีความซับซ้อนมากเกินไป ทำให้ต้องการความรู้และการอบรม
ผู้ใช้อาจต้องมีความรู้ด้านสถิติในการอ่านและแปลผล

Text mining เป็นการจัดกระทำกับข้อมูลที่ไม่มีรูปแบบ (Unstructured Data) เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน สำหรับการนำไปใช้นั้น เครื่องมือนี้จะออกมาในรูปแบบของการ detect e-mail spam โดยการ detect keyword บางคำ หรือการส่งต่อกระบวนการทำงานอย่างอัตโนมัติให้แก่ผู้ที่รับผิดชอบ เช่น โทรศัพท์ตอบรับอัตโนมัติที่ให้กดเบอร์ตามฝ่ายที่ต้องการและจะโอนให้โดยตร

นางสาวกาญจนา  แซ่พ่าน  5202115068

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

Week 8 : Data Management

Data management



ระบบ (System) คือ การใส่ input เข้าไปใน process ให้เกิด output ตามวัตถุประสงค์ที่กำหนดไว้ ซึ่งวัตถุประสงค์จะเป็นตัวกำหนดว่า input ประกอบดัวยอะไรบ้าง ดังนั้นหากใส่ input ต่างกัน output ก็จะต่างกันด้วย


ระบบสารสนเทศ (Information system) คือ ระบบที่เก็บรวบรวมข้อมูล เพื่อนำไปวิเคราะห์และใช้ประโยชน์ในอนาคต ซึ่งแตกต่างกันออกไปตามแต่ละวัตถุประสงค์ และแต่ละสาขาที่ต้องการ เช่น MKIS สำหรับงานการตลาด AIS สำหรับงานบัญชี เป็นต้น


ความแตกต่างระหว่าง data และ information


data คือ ข้อเท็จจริงที่สนใจ


information คือ ข้อมูลที่ผ่านการประมวลผลและวิเคราะห์แล้ว เพื่อนำไปใช้ในรูปแบบที่ต้องการ


องค์ประกอบของระบบ(System)


• วัตถุประสงค์ (Obj.)


• ส่วนประกอบ (Elements)


• กระบวนการทำงาน > สิ่งที่นำเข้า (Inputs),กระบวนการ(Process),ผลลัพธ์(Output)


• สิ่งแวดล้อม (Environment)


• ขอบเขต (Boundary)


• การควบคุมและผลย้อนกลับ (Feedback)


Data manament


การจัดการข้อมูล มีปัญหาต่างๆ หลายสาเหตุ ได้แก่


1.ไม่สามารถเก็บข้อมูลได้ทุกอย่าง เพราะจำนวนข้อมูลเพิ่มมากขึ้น


2. ข้อมูลกระจัดกระจาย เก็บรวบรวมยาก


3. ข้อมูลมีความซับซ้อน


4. รูปแบบของข้อมูลมีความแตกต่างกัน


5. ความปลอดภัย คุณภาพและจริยธรรมในการใช้ข้อมูล


6. เครื่องมือที่ใช้ข้อมูล


วัตถุประสงค์คือการจัดทำโครงสร้างพื้นฐานเพื่อแปลงข้อมูลดิบเป็นสารสนเทศขององค์กรมีพื้นฐานดังนี้


1. Data profiling ข้อมูลเบื้องต้นของข้อมูลที่จัดเก็บ


2. Data quality management เพื่อการปรับปรุงคุณภาพของข้อมูล


3. Data integration เป็นการรวบรวมข้อมูลที่เหมือนกันจากหลายแหล่งเข้าด้วยกัน


4. Data augmentation เพื่อเพิ่มคุณค่าของข้อมูล


Data Life Cycle Process แบ่งออกเป็น 4 ขั้นตอน ดังนี้


1. เก็บรวบรวมข้อมูลจาก3 แหล่งคือ Internal Data, External Data และ Personal Data


2. เก็บข้อมูลใน database และปรับเปลี่ยนรูปแบบ(format)ของข้อมูลเข้าสู่ data warehouse


3. คัดลอกข้อมูลเพื่อการวิเคราะห์ต่อไป


4. การวิเคราะห์ใช้เครื่องมือ เช่น Data analysis tools และ Data mining tools


Data Processing แบ่งได้เป็น 2 ประเภท


1. Transactional เป็นระบบปฏิบัติการ (Operational systems) ใช้ TPS จัดเก็บข้อมูลและแปลผลจากส่วนกลาง


2. Analytical เป็นการเอาข้อมูลมาใช้ประมวลผลอีกครั้งเพื่อการตัดสินใจระดับสูงขึ้นไป นำข้อมูลเหล่านี้ไปใช้วิเคราะห์ต่อ


Data Warehouse การทำ Data Warehouse นั้นเป็นเหมือนขั้นตอนการเตรียมข้อมูลเฉพาะที่ต้องการ เพื่อนำไปใช้ในการวิเคราะห์และประมวลผลเพื่อการตัดสินใจอีก ซึ่งจะเหมาะกับองค์กรที่ผู้บริหารเน้นการใช้ข้อมูลในวิเคราะห์ตัดสินใจ ดังนั้น ไม่ใช่ทุกองค์กรที่จะต้องทำ Data Warehouse


ประโยชน์ของ Data Warehouse


1. เข้าถึงข้อมูลได้เร็ว


2. เข้าถึงข้อมูลได้ง่าย


ลักษณะของ Data warehouse


1. Organization จัดหมวดหมู่ของข้อมูลตามหัวข้อ


2. Consistency ข้อมูลต้องมีรูปแบบที่สม่ำเสมอ


3. Time variant ข้อมูลที่เก็บนาน 5-10 ปี สามารถนำมาวิเคราะห์หาแนวโน้มได้


4. Non-volatile ไม่มีการแก้ไขข้อมูลในอดีต


5. Client/server ใช้ server ให้ผู้ใช้สามารถเข้าถึงข้อมูลได้ง่าย


องค์กรที่เหมาะกับ Data warehouse


• ข้อมูลเยอะ


• ข้อมูลถูกเก็บในที่ที่มีDatabaseเยอะ format ต่างกัน


• ผู้บริหารเป็น Information Base






นางสาวกาญจนา แซ่พ่าน 5202115068