CHAPTER 5 SELECTION CRITERIA FOR A PLS CALIBRATION - METHOD OPTIMIZATION
CHAPTER 5 SELECTION CRITERIA FOR A PLS CALIBRATION - METHOD OPTIMIZATION
บทที่ 5
เกณฑ์ในการเลือกสำหรับการทำคาลิเบรชั่นแบบ PLS; การทำให้วิธีเหมาะสม
SELECTION CRITERIA FOR A PLS CALIBRATION; METHOD OPTIMIZATION
โดยหลักการมีความเป็นไปได้ในการสร้างแบบจำลองเคโมเมตริกได้มากมาย อย่างไรก็ตาม โดยทั่วไปมีความเป็นไปได้ที่จะได้ผลการวิเคราะห์ที่พอใจ โดยทำให้แบบจำลองเหมาะสมโดยใช้ตัวแปรของระบบเพียง 2-3 ตัวแปรเท่านั้น
ในบริบทนี้เป็นการเลือกช่วงของสเปกตรัมของชุดคาลิเบรชั่น การเลือกวิธีการจัดการข้อมูลเบื้องต้น การเลือกและคุณภาพของมาตรฐานของการคาลิเบรชั่นเป็นสิ่งสำคัญ ในบทนี้จะอธิบายถึงเกณฑ์การเลือกที่สำคัญที่สุด ทำให้ผู้วิเคราะห์สามารถทำให้การวัดเหมาะสม (ดีที่สุด)
A. การเลือกช่วงความเข้มข้นและค่าองค์ประกอบ (Selecting the Concentration Range and Component Values)
ช่วงความเข้มข้นที่ใช้ทำคาลิเบรชั่นควรจะกว้างมากกว่าช่วงของความเข้มข้นของตัวอย่างเล็กน้อย โดยวิธีนี้แบบจำลองจะมีความครอบคลุม “Robust” เมื่อพิจารณาค่าองค์ประกอบซึ่งมีขีดจำกัดอยู่ในช่วงคาลิเบรชั่น ซึ่งสิ่งนี้มีความสำคัญ เช่น ถ้าต้องการวิเคราะห์ชุดตัวอย่างที่เลว “bad batches” จากกระบวนการผลิตให้แม่นยำ สิ่งเหล่านี้มักมีการเบี่ยงเบนอย่างมีนัยสำคัญของค่าความเข้มข้น และช่วงความเข้มข้นที่จะใช้ในการคาลิเบรชั่นจะต้องมีความกว้างอย่างเพียงพอเพื่อที่จะให้การวิเคราะห์ตัวอย่างเชื่อถือได้ รูปที่ 5.1 แสดงการเปรียบเทียบค่าอ้างอิงและค่าการวิเคราะห์ (ด้วยแบบจำลอง)
รูปที่ 5.1 การเลือกช่วงของความเข้มข้น : ตัวอย่างที่อยู่ในช่วงความเข้มข้นที่ “พบได้ทั่วไป” จะให้ผลลัพธ์ที่แม่นยำ แต่ตัวอย่างที่มีของความเข้มข้นขององค์ประกอบทางเคมีออกนอกช่วงจะให้ผลลัพธ์ที่ไม่แม่นยำ
ค่าขององค์ประกอบใดๆ ควรกระจายอยู่ตลอดในช่วงทั้งหมดของความเข้มข้นอย่างเท่าๆกัน ไม่แนะนำให้นำตัวอย่างที่อยู่นอกช่วงปกติมารวมในชุดข้อมูลคาลิเบรชั่น (ดูรูปที่ 5.1) ถ้าหากช่วงความเข้มข้นของแบบจำลองที่มีอยู่จำเป็นต้องขยายออก ก็จะเป็นที่จะต้องขยายขอบเขตชุดข้อมูลให้กว้างขึ้น
B. การสร้างตัวอย่างคาลิเบรชั่นที่เป็นตัวแทน (Creating Representative Calibration Samples)
จุดที่มีความสำคัญอีกจุดหนึ่งที่ต้องพิจารณาถึงคือ สิ่งรบกวนจากภายนอก ซึ่งสามารถเกิดขึ้นได้ระหว่างการวัดตัวอย่างและเป็นสิ่งที่ไม่สามารถหลีกเลี่ยงได้โดยวิธีการเตรียมตัวอย่างที่เหมาะสม ตัวอย่างเช่น การวัดเชิงสเปกตรัมในสายการผลิตของกระบวนการทางเคมี จากที่เห็นได้บ่อย ๆ คือ การเตรียมหรือการวัดอุณหภูมิความร้อนของตัวอย่างเป็นสิ่งที่ไม่สามารถเป็นไปได้ ในทางเดียวกัน การควบคุมคุณภาพสมัยใหม่นั้นโดยมากไม่อนุญาตให้มีการเตรียมตัวอย่างที่มีขอบเขตกว้างมากเกินไป แต่ถ้าหากมีเทคนิคช่วยให้มีความเป็นไปได้มากขึ้น ราคาก็มักจะสูงขึ้นตามไปด้วย
ในที่นี้ เคโมเมทริกเป็นเครื่องมือที่สำคัญในการแก้ไขปัญหาดังกล่าว การทับซ้อนกันหรือความผิดปกติในรูปร่างของสัญญาณของตัวอย่าง ซึ่งมีสาเหตุมาจากการปนเปื้อนหรือจากความแปรปรวนของอุณหภูมิจากตัวอย่าง เหล่านี้สามารถจัดการได้โดยวิธีสร้างแฟคเตอร์ (Factorization of the spectra) เนื่องจากพารามิเตอร์ของระบบที่เกี่ยวข้องถูกเก็บไว้ที่เป็นตัวบล็อกข้อมูลที่มีความเป็นอิสระ (นั่นคือ แฟคเตอร์) สิ่งรบกวนที่เข้ามาทับซ้อนในสเปกตรัมสามารถถูกกำจัดออกไปโดยง่าย เพื่อวัตถุประสงค์นี้ สิ่งรบกวนที่มีศักยภาพทั้งหมดถูกนำมาเลียนแบบระหว่างการคาลิเบรชั่น และถูกนำมาจัดเก็บเป็นแฟคเตอร์อิสระ เมื่อเปรียบเทียบค่าต่าง ๆ เหล่านี้กับค่าอ้างอิงขององค์ประกอบทางเคมีของตัวอย่าง อัลกอริธึมจะ “ตรวจสอบ” ว่าข้อมูลนี้ไม่ได้มาจากตัวองค์ประกอบทางเคมีเอง ดังนั้นโครงสร้างที่สอดคล้องกันจะไม่ถูกนำมาใช้เพื่อการทำนายตัวอย่างใหม่ที่รู้จักมาก่อน กล่าวได้อีกอย่างหนึ่งว่า อัลกอริธึมของ PLS สามารถแยกแยะ ระหว่างสิ่งที่เกี่ยวข้องเพื่อการวิเคราะห์กับโครงสร้างที่ไม่ประโยชน์ในการวิเคราะห์สเปกตรัม สิ่งรบกวนจะถูกตรวจจับได้ระหว่างการคาลิเบรชั่น และถูกกำจัดออกไปจากขั้นตอนการวิเคราะห์ต่อไป
หน้าที่ของผู้พัฒนาวิธีการ คือ การวัดตัวอย่างในสภาพที่เป็นจริง ดังนั้น สิ่งรบกวนที่มีศักยภาพทั้งหลายที่เข้ามาแทรกแซงในระบบควรถูกนำมาพิจารณาเพื่อทำให้อัลกอริธึม “เรียนรู้” เพื่อจะได้จดจำและกำจัดสิ่งรบกวนเหล่านั้นออกไป ความแปรปรวนทั้งหลายที่สามารถเกิดขึ้นได้ในความเป็นจริงควรถูกนำมาพิจารณาสำหรับตัวอย่างชุดคาลิเบรชั่น เพียงเท่านี้ก็สามารถแน่ใจได้ว่าชุดตัวอย่างนี้สามารถใช้เป็นตัวแทนและมีความเหมาะสมในการพัฒนาวิธีการ ดังนั้น จึงไม่แนะนำให้ทำการคาลิเบรชั่นภายใต้สภาพเงื่อนไขที่เป็นอุดมคติ (ไม่เป็นจริง) ที่สุด ในการวัดตัวอย่างของสารบริสุทธิ์ที่ควบคุมอุณหภูมิอย่างดี จะนำไปสู่ค่าความผิดพลาดที่น้อยมากในการวิเคราะห์ แต่แบบจำลองจะไม่ครอบคลุมสภาวะเป็นจริง (Robust) เพียงพอในการนำมาใช้ในภาคปฎิบัติ ผลกระกระทบของอุณหภูมิของตัวอย่างแสดงโดยตัวอย่างต่อไปนี้ เนื่องจากมีพันธะไฮโดรเจน สเปกตรัมของน้ำจึงมีความไวต่ออุณหภูมิที่เปลี่ยนไปมาก เมื่ออุณหภูมิเพิ่มขึ้นโมเลกุลของน้ำจะเคลื่อนที่เร็วขึ้นซึ่งจะนำไปสู่การแตกตัวของพันธะไฮโดรเจน อิเล็กตรอนจะเคลื่อนที่กลับสู่พันธะ O-H ซึ่งนำไปสู่การเพิ่มขึ้นของค่าคงที่ของแรง โมเลกุลจะสั่นสะเทือนมากขึ้นและการดูดซับคลื่นในสเปกตรัมจะขยับไปที่ความถี่ (จำนวนคลื่น Wavenumber) สูงขึ้น ยิ่งน้ำถูกทำให้ร้อน พีคการดูดซับคลื่นของน้ำจะยิ่งขยับไปที่จำนวนคลื่นมากขึ้น นอกจากนี้น้ำจะขยายตัวเมื่ออุณหภูมิสูง ทำให้ความหนาแน่นลดลงซึ่งทำให้ความสูงของสัญญาณลดลง ดังนั้นเมื่ออุณหภูมิเพิ่มขึ้นสเปกตรัมของน้ำจะลดความเข้มของสัญญาณลงและพีคจะขยับมาทางเลขคลื่นที่สูงขึ้น (ดูรูปที่ 5.2)
รูปที่ 5.2 อิทธิพลของอุณหภูมิต่อ 1st overtone ของน้ำ (ทางแสงผ่าน 1 mm, สารอ้างอิงเป็นอากาศ)
สำหรับแม้แต่ความแตกต่างของอุณหภูมิที่มากขึ้น การขยายออกและการบิวเบี้ยวของสเปกตรัมสามารถสังเกตเห็นได้ ผลนี้เกิดจากความแตกต่างของความหนาแน่นของระดับการสั่นสะเทือนแบบหมุนของโมเลกุล เพื่อให้ง่าย จะไม่แสดงการอธิบายลักษณะของกราฟที่เกิดจากสิ่งที่กล่าวข้างต้น
มีความชัดเจนที่ว่าการคาลิเบรชั่นสารละลายที่ควบคุมอุณหภูมิไม่สามารถให้ผลที่น่าเชื่อถือถ้าการวิเคราะห์ถูกกระทำที่อุณหภูมิแตกต่างกันต่อไป ถ้าการคาลิเบรชั่นถูกดำเนินการภายใต้การกำหนดสภาวะอย่างจริงจัง มันเป็นสิ่งที่จำเป็นที่ต้องทำให้เหมือนเดิมในระหว่างการวิเคราะห์ นอกจากนั้น มีข้อพิจารณาว่าวิธีการเคโมเมทริกซ์จะต้องถูกปรับตามการเปลี่ยนแปลงในองค์ประกอบของผลิตภัณฑ์หรือคุณภาพของผลิตภัณฑ์ สิ่งนี้จะจริงถ้าการวัดพารามิเตอร์เปลี่ยนแปลงไป โดยทั่วไปวิธีการจะทำงานได้เฉพาะภายใต้สภาวะซึ่งอยู่ภายใต้การปรับตั้งขึ้น และเฉพาะสิ่งรบกวนเหล่านั้นถูกรับรู้ซึ่งถูกครอบคลุมในการคาลิเบรชั่น สำหรับเหตุผลนี้ จึงต้องการการบำรุงรักษาวิธีการซึ่งมักจะทำที่ขั้นตอนต่อไป
การปรับตั้งและการบำรุงรักษาวิธีการป็นสิ่งที่ง่ายทีเดียว โดยมันไม่จำเป็นต้องสัมพันธ์ค่าอ้างอิงกับการรบกวนหรือค่าของอุณหภูมิ สิ่งนี้เป็นผลจากการทำแฟคเทอไรเซชั่น (Factorization) เพื่อที่จะชดเชยการรบกวนที่ไม่ต้องการในสมการคาลิเบรชั่นหลายตัวแปร ค่าการวิเคราะห์ที่คำนวณได้ไม่ถูกแก้ไขโดยฟังชั่นการปรับแต่งซึ่งสร้างขึ้นภายใน การทำอัลกอริธึม PLS1 มีเป้าหมายที่จะหาความสัมพันธ์ระหว่างองค์ประกอบและโครงสร้างของสเปกตรัม ข้อมูลอื่นๆไม่ได้ถูกคำนึงถึง มันไม่มีความแตกต่างว่ามันจะมีสาเหตุจากการปนเปื้อน สารที่จะวิเคราะห์ต่อไปหรือสัญญาณรบกวนสเปกตรัม (ดูในบทที่ 2)
ดังนั้นสิ่งนี้จึงเพียงพอสำหรับการทำคาลิเบรชั่นที่จะมีกลุ่มข้อมูลซึ่งถูกวัดภายใต้สภาวะที่แท้จริง ค่าของข้อมูลอ้างอิงขององค์ประกอบที่มีการรบกวนไม่มีความสำคัญ จากตัวอย่างข้างต้นนั้นสำหรับการทำคาลิเบรชั่นของสารละลาย มันเพียงพอที่จะวัดตัวอย่างที่ช่วงที่เป็นตัวแทนชองอุณหภูมิ การบันทึกอุณหภูมิไม่มีความจำเป็น เช่นเดียวกันถ้ามีการเปลี่ยนแปลงคุณภาพของตัวอย่างทำให้ต้องปรับปรุงแบบจำลอง จะต้องเพิ่มตัวอย่างของข้อมูลชุดใหม่ถูกเข้าสู่แบบจำลองที่มีอยู่ ต่อจากนั้นแบบจำลองก็ควรทำงานได้อย่างน่าเชื่อถืออีกครั้ง
C. อิทธิพลของสภาวะแวดล้อมที่มีผลต่อเครื่องมือวัด (Ambient Influences on the Instrument)
ตัวอย่าง(ที่เป็นตัวแทน)ในชุดคาลิเบรชั่นเป็นสิ่งแรกที่ทำให้แบบจำลองเคโมเมทริกมีความเสถียร มันชัดเจนว่าอิทธิพลของสภาพแวดล้อมที่มารบกวนมีผลต่อลักษณะของตัวอย่าง และลักษณะของการวัดของเครื่องมือวัดด้วย ในกรณีของ optical spectroscopy ขึ้นอยู่กับอุณหภูมิของสภาพแวดล้อม รวมถึงอิทธิพลของสภาพบรรยากาศ เช่น การแพร่ของ CO2 หรือไอน้ำ ใน และ/หรือ จากสเปกโทรมิเตอร์ ซึ่งอธิบายได้ดังตัวอย่างต่อไปนี้
ในขณะที่การแพร่ของ CO2 และ H2O จะทำให้เกิดการรบกวนอย่างมากต่อสเปกตรัมของ MIR ใน NIR-สเปกโทรสโกปี โดยเฉพาะน้ำที่ปนอยู่ในบรรยากาศ ซึ่งแทรกซึมเข้าสู่เครื่องมือ มีผลต่อการวัดอย่างชัดเจน
รูปที่ 5.3 แสดงอิทธิพลของความชื้นที่แพร่เข้าสู่ NIR-สเปกโทรมิเตอร์ สเปกตรัมแรกจะถูกวัดทันทีหลังจากการวัดวัสดุอ้างอิง จะเห็นว่าไม่มีสิ่งรบกวนเมื่อเพิ่มตัวดูดซับไอน้ำ หลังจากการวัดเครื่องถูกนำไปวางในพื้นที่ที่มีความชื้นสูงผิดปกติ สเปกตรัมต่อมาที่ถูกวัด 1 สัปดาห์ถัดมาโดยไม่มีการวัดวัสดุอ้างอิงใหม่ จะเห็นว่ามีโครงสร้างแหลมมากมากมายในช่วงสเปกตรัมอยู่ที่ประมาณ 7,500 – 6,700 cm-1 และ 5,800 – 5,000 cm-1 ซึ่งซ้อนทับสเปกตรัมเดิม สิ่งรบกวนมีผลต่อโครงสร้างเดิมอย่างมากจนไม่สามารถจำโครงสร้างเดิมได้
ช่วงของสเปกตรัมซึ่งแสดงการรบกวนต้องไม่รวมเข้าในการประเมิน วิธีการจะต้องตั้งค่าโดยปราศจากช่วงของสเปกตรัมเหล่านั้น ถ้ามันเป็นไปไม่ได้ จะต้องวัดสเปกตรัมใหม่ของวัสดุอ้างอิงในช่วงสั้นๆ หรือเครื่องมือจะต้องมีการระบายอากาศ
รูปที่ 5.3 สเปกตรัมการดูดซับก่อน (บน) และหลัง (ล่าง) การแพร่ของความชื้นของอากาศเข้าสู่สเปกโตรมิเตอร์แบบ NIR (MATRIX-F, Bruker Optik GmbH) สเปกตรัมที่ถูกขยับขึ้นในแกน y เพื่อทำให้เห็นได้ง่ายขึ้น
D. ปัญหาของความเป็นเชิงเส้นแบบร่วม (Collinearity)
โดยหลักการ จะมีอยู่ 2 วิธีการที่จะใช้สร้างชุดข้อมูลคาลิเบรชั่น วิธีแรกคือตัวอย่างสามารถถูกวัดและค่าอ้างอิงสามารถถูกวัดได้เช่นกันด้วยวิธีการวิเคราะห์ (มาตรฐาน) ที่เป็นอิสระ ในทางกลับกันตัวอย่างสามารถถูกทำขึ้นเองได้ในห้องปฏิบัติการ นอกจากการกระจายระดับความเข้มข้นให้สม่ำเสมอกันตลอดช่วงความเข้มข้นทั้งหมด (ดูที่ผ่านมา) ในกรณีที่มีหลายองค์ประกอบรวมกันอยู่ มันมีความสำคัญว่าปริมาณความเข้มข้นขององค์ประกอบต้องไม่เปลี่ยนแบบเป็นเชิงเส้นแบบร่วม (Collinearity) นั่นหมายความว่าความเข้มข้นของแต่ละองค์ประกอบ ต้องไม่เพิ่มขึ้นหรือลดลงอย่างเท่าๆกันในแต่ละตัวอย่าง (รูปที่ 5.4)
ในกรณีของชุดข้อมูลเชิงเส้นแบบร่วม PLS อัลกอริธึมไม่สามารถกำหนดแถบสเปกตรัมได้ชัดเจนต่อค่าองค์ประกอบที่สอดคล้องกัน วิธีการที่สร้างขึ้นในลักษณะนี้จะไม่ได้ผลสำหรับการวิเคราะห์ชุดข้อมูลที่ไม่เป็นเชิงเส้นแบบร่วม (Non-collinear data sets)
รูปที่ 5.4 แถวบน : ชุดข้อมูลเชิงเส้นแบบร่วมมีตัวอย่าง 3 ตัวอย่างที่มีองค์ประกอบ “A” และ “B” องค์ประกอบหนึ่งเปลี่ยนแปลงไปสำหรับทั้งสามตัวอย่างในลักษณะเดียวกัน นั่นคือชุดข้อมูลเชิงเส้นแบบร่วม แถวล่าง : ไม่ใช่ชุดข้อมูลเชิงเส้นแบบร่วม คือองค์ประกอบไม่เปลี่ยนแปลงอย่างมีระบบ
ชุดข้อมูลคาลิเบรชั่นแบบเชิงเส้นแบบร่วม จะใช้ได้หากมั่นใจได้ว่าค่าองค์ประกอบของตัวอย่างที่จะวิเคราะห์ในอนาคตเป็นเชิงเส้น ตัวอย่างเช่นนี้จริงสำหรับทุกระบบที่มีสององค์ประกอบ โดยการเพิ่มขึ้นของความเข้มข้นขององค์ประกอบหนึ่งที่นำไปสู่การลดลงของ (นั่นคือเชิงเส้น) ที่สอดคล้องกันขององค์ประกอบอีกชนิดหนึ่งเนื่องจากค่าทั้งสองต้องรวมกันเท่ากับ 100%
แต่ระบบหลายองค์ประกอบที่ซับซ้อนก็แสดงให้เห็นความเป็นเชิงเส้นแบบร่วม (Collinearity) ตามธรรมชาติ ตัวอย่างเช่นในการผลิตพลาสติก ระดับพอลิเมอไรเซชั่นของผลิตภัณฑ์มักจะเพิ่มขึ้นอย่างเท่าเทียมกันกับปริมาณสารสกัด ด้วยวิธีนี้การหาค่าที่ถูกต้องของระดับพอลิเมอไรเซชั่นจะประสบความสำเร็จด้วยความช่วยเหลือของการวิเคราะห์ทางสเปกโทรสโกปี ความเข้มข้นของวัสดุพื้นฐาน (ไม่ใช่ระดับพอลิเมอไรเซชั่น) จะถูกพิจารณา แต่เนื่องจากการเชื่อมโยงโดยตรง (Collinear) ของทั้งสองพารามิเตอร์ การวิเคราะห์จะสำเร็จได้อย่างง่ายดาย ซึ่งหลักการนี้ใช้ได้ทั่วไป ปัจจุบันนี้พารามิเตอร์ทางฟิสิกส์ส่วนมาก สารที่ไม่มีปฏิกิริยากับ IR หรือ ความเข้มข้นที่ต่ำกว่าค่าจำกัดที่วัดได้ สามารถถูกพิจารณา (หาหรือวัด) ได้อย่างง่ายด้วยความช่วยเหลือของ NIR สเปกโทรสโกปี ถ้าค่าเหล่านี้มีความเป็นเชิงเส้น (Collinearly) ซึ่งค้นพบได้กับองค์ประกอบที่วัดได้อื่นๆ
จะเป็นไปไม่ได้อย่างชัดเจนถ้าค่าองค์ประกอบสามารถเปลี่ยนแปลงเป็นอิสระจากกัน ในกรณีนี้ควรจะตั้งข้อสังเกตว่าค่าเหล่านี้มีการกระจายทางสถิติครอบคลุมทุกตัวอย่าง ดังนั้นจึงไม่แนะนำให้สร้างมาตรฐานสำหรับคาลิเบรชั่นจากชุดตัวอย่างที่ทำการเจือจาง เนื่องจากไม่เพียงแต่องค์ประกอบที่ต้องการวัดจะเจือจางแต่องค์ประกอบอื่นๆจะเจือจางไปด้วย อัลกอริธึมไม่สามารถแยกความแตกต่างระหว่างค่าแต่ละอย่างและการพิสูจน์จะนำไปสู่ผลลัพธ์ที่ไร้ประโยชน์
ในบริบทนี้จะไม่แนะนำให้วัดค่าความเข้มข้นของชุดคาลิเบรชั่นมาตรฐานในลำดับจากน้อยไปหามากหรือลำดับจากมากไปหาน้อย การเปลี่ยนแปลงของระบบในตัวอย่าง เช่น การเพิ่มขึ้นของอุณหภูมิระหว่างชุดของการวัดสามารถจำลองความสัมพันธ์กับคุณสมบัติของระบบ การวัดตัวอย่างอีกครั้งในขั้นตอนภายหลังและเปรียบเทียบกับสเปกตรัมที่วัดก่อนหน้านี้จะรับประกันว่าไม่มีการเปลี่ยนแปลงของระบบถูกรวมอยู่ในการคาลิเบรชั่น
มันมีประโยชน์ที่จะคำนึงถึงปัญหาของความสัมพันธ์เชิงเส้นแบบร่วม (collinearity) จากจุดเริ่มต้นเมื่อเริ่มสร้างชุดข้อมูลคาลิเบรชั่น หลังจากนั้นก็อาจจะไม่ง่ายที่จะรู้ว่าค่าองค์ประกอบเดี่ยวจะเปลี่ยนแปลงไปในทางที่มีความสัมพันธ์เชิงเส้น (collinear) ซึ่งแสดงดังตัวอย่างต่อไปนี้:
ตารางที่ 5.1 ตัวอย่างของชุดข้อมูลที่มีความสัมพันธ์เชิงเส้นตรง
เลขที่ |
X |
X. 3.9 |
X. 0.4 |
X / 120 |
(X. 0.3) + 15 |
100 - 2X |
50 – (X. 1.7) |
1 |
1 |
3.9 |
0.4 |
0.00833333 |
15.3 |
98 |
48.3 |
2 |
2 |
7.8 |
0.8 |
0.01666667 |
15.6 |
96 |
46.6 |
3 |
5 |
19.5 |
2 |
0.04166667 |
16.5 |
90 |
41.5 |
4 |
7 |
27.3 |
2.8 |
0.05833333 |
17.1 |
86 |
38.1 |
5 |
8 |
31.2 |
3.2 |
0.06666667 |
17.4 |
84 |
36.4 |
6 |
9 |
35.1 |
3.6 |
0.075 |
17.7 |
82 |
34.7 |
... |
... |
... |
... |
... |
... |
... |
... |
จำนวนในแต่ละคอลัมน์สามารถสร้างขึ้นโดยการแปลงอย่างง่ายจากตัวเลขในคอลัมน์ "X" ดังนั้นมันจึงมีความสัมพันธ์เป็นเชิงเส้นแบบร่วม เรียกว่า collinear สิ่งนี้สามารถประยุกต์ใช้ไม่เพียงแต่เฉพาะคอลัมน์แรก ตัวเลขของแต่ละคอลัมน์มีความสัมพันธ์เป็นเชิงเส้นแบบร่วม (collinearly) กับตัวเลขในคอลัมน์อื่นๆของทุกๆ คอลัมน์ การเปลี่ยนแปลงสัมพัทธ์ขององค์ประกอบต่างๆมีค่าเหมือนกันสำหรับแต่ละตัวอย่าง อย่างไรก็ตาม collinearly อาจไม่เป็นที่รู้จักตั้งแต่แรกเห็น ดังนั้นจึงมีประโยชน์ที่จะให้ความสนใจกับการกระจายอย่างอิสระของค่าแต่ละองค์ประกอบในตอนเริ่มต้น
E. การวัดแบคกราวน์ (Performing a Background Measurement)
สำหรับการวัดเชิงสเปกโทรสโกปิกส่วนใหญ่ จะแนะนำให้ดำเนินการตรวจวัดแบคกราวน์ใหม่เป็นครั้งคราว ด้วยวิธีนี้อิทธิพลของสภาพแวดล้อมต่อการวัด (เช่น สเปกโทรมิเตอร์ ใยแก้วนำแสง คิวเวต ฯลฯ) จะได้รับการชดเชย ดังนั้นการวิเคราะห์ที่ต้องการความแม่นยำสูงจึงสามารถเป็นไปได้
เมื่อเลือกวัสดุอ้างอิง ควรใช้ความระมัดระวังว่าสารเหล่านี้ควรเป็นสารเฉื่อยมากเท่าที่เป็นไปได้และเป็นสารที่แสดงการดูดซับคลื่นในช่วงสเปกตรัมซึ่งเกี่ยวข้องกับการประเมินผล ขั้นตอนการวัดแบคกราวน์ต่อไปนี้ได้ถูกพิสูจน์แล้วว่ามีประโยชน์ในการทำ (N)IR-สเปกโทรสโกปี:
- การวัดก๊าซ:
MIR: สุญญากาศหรือไนโตรเจนแห้ง
NIR: อากาศทั่วๆไป, หรืออาจใช้สุญญากาศ หรือไนโตรเจนแห้ง (ใช้น้อย)
- การวัดของเหลว:
MIR: อากาศทั่วๆไป, ในบางกรณีตัวทำละลายบริสุทธิ์ (เฉพาะที่อุณหภูมิคงที่; ดูรายละเอียดด้านล่าง)
NIR: อากาศทั่วๆไป
- การวัดของแข็ง:
MIR: potassium bromide หรือ caesium iodide แห้ง
NIR: เทฟลอนหรือพื้นผิวโลหะที่ขรุขระซึ่งกระจายแสง (ส่วนใหญ่เป็นทอง)
ในสเปกโทรสโกปีแบบราแมน โดยปกติจะไม่มีการวัดแบคกราวน์ (background)
อิทธิพลของแก๊สในบรรยากาศ (เช่น CO2 และ H2O) ต่อการวัดในช่วงอินฟราเรดย่านกลาง โดยปกติจะมีผลสูงมากจนเครื่องสเปกโตรมิเตอร์จำเป็นจะต้องไล่อากาศออกด้วยการผ่านไนโตรเจนเข้าไป
ในทางตรงกันข้าม การวัดแบบ NIR มีความไวน้อยและได้รับผลกระทบอย่างเห็นได้ชัดต่อน้ำในบรรยากาศ โดยทั่วไปการถูกรบกวนจะถูกชดเชยด้วยการอ้างอิงปกติ (เช่นทุกชั่วโมง) ดังนั้นรูปแบบในการประยุกต์ใช้ในห้องปฏิบัติการสามารถกระทำได้ในแบบ NIR โดยไม่ต้องระมัดระวังอิทธิพลนี้ อย่างไรก็ตามไม่สามารถประยุกต์ใช้กับกระบวนการส่วนใหญ่ อุปกรณ์มักจะทำงานเป็นเวลาหลายเดือนโดยใช้แบคกราวน์เดียวกัน การเปลี่ยนแปลงความชื้นของอากาศรอบนอกมีผลต่อการวิเคราะห์ในช่วงสเปกตรัมประมาณ 7, 500-6, 700 cm-1 และประมาณ 5, 800-5, 000 cm-1 (ดูจากด้านบน) ถ้าช่วงนี้เป็นสิ่งสำคัญสำหรับการประเมินผล อุปกรณ์เหล่านี้จะถูกผ่านด้วยไนโตรเจนหรืออากาศที่ปราศจากน้ำมัน เพื่อไล่อากาศชื้นออก
การใช้วัสดุอ้างอิงที่ไม่ดูดซับคลื่นหรือดูดซับคลื่นต่ำและเฉื่อยเป็นสิ่งที่จำเป็นสำหรับการทำมาตรฐาน (Standardization) ของสเปกตรัมและวิธีการดังกล่าวมาแล้วใน NIR สเปกโทรสโกปี ความสูง ความกว้าง รูปร่าง ตำแหน่งของแถบการดูดซับคลื่นขึ้นอยู่กับอุณหภูมิรอบนอก ถ้าการวัดวัสดุอ้างอิงและการวัดตัวอย่างไม่ได้ถูกบันทึกไว้ที่อุณหภูมิเดียวกันจะสามารถเห็นสิ่งที่ไม่เป็นธรรมชาติ (artefacts) ของวัสดุอ้างอิง ถ้าวัสดุอ้างอิงแสดงการดูดซับคลื่นในช่วงสเปกตรัมนั้นๆ ซึ่งจะปรากฏว่าว่าที่ความถี่เดียวกันที่การดูดซับของคลื่นที่เกิดขึ้นในวัสดุ แสดงดังรูปที่ 5.5 โดยเป็นตัวอย่างของการวัด NIR สเปกโทรสโกปีของน้ำ
รูปที่ 5.5 โครงสร้างของสเปกตรัมซึ่งเกิดจากการขยายตัวของ 1st overtone ของน้ำซึ่งเพิ่มขึ้นตามอุณหภูมิที่สูงขึ้น สำหรับการวัดแบคกราวน์และตัวอย่างจะใช้น้ำบริสุทธิ์ โดยวัดแบคกราวน์ที่อุณหภูมิ 30 ºC ส่วนตัวอย่างวัดที่อุณหภูมิเพิ่มขึ้นถึง 60 ºC
ตัวอย่างเช่นเดียวกับในรูปที่ 5.2 ถูกวัดโดยการวัดวัสดุอ้างอิงวัดเทียบกับอากาศและไม่พบสิ่งรบกวนใดๆ ขณะนี้โดยที่มีน้ำเป็นวัสดุอ้างอิง โครงสร้างสามารถสังเกตได้ซึ่งซ้อนทับสเปกตรัมเดิม สิ่งนี้มีผลกระทบที่มารบกวนต่อการประเมินทางเคโมเมทริก ในการวัดเทียบกับอากาศจะแสดงค่าที่มีการขจัดเล็กน้อย (ดูรูปที่ 5.2) ซึ่งมีผลกระทบต่อการวิเคราะห์น้อยกว่า ดังนั้นจึงเป็นเรื่องที่ชัดเจนว่าในสเปกโทรสโกปีแบบการสั่น (Vibrational spectroscopy) โดยทั่วไปการใช้ตัวอย่างในการวัดแบคกราวน์เป็นสิ่งไม่มีประโยชน์
สมการต่อนี้ใช้ในการวิเคราะห์ทางเคมี
[สเปกตรัมของสารประกอบ] - [สเปกตรัมของเมทริกซ์] = [สเปกตรัมของสารบริสุทธิ์ที่วิเคราะห์]
หรือ พูดง่ายๆ คือ
[เมทริกซ์+สารที่วิเคราะห์]-[เมทริกซ์]=[สารที่วิเคราะห์]
ไม่สามารถใช้ในเนียร์อินฟราเรด (NIR) และ ราแมน (Raman) สเปกโทรสโกปี (หรือเฉพาะที่แบล็คกราวน์ (สิ่งแวดล้อม) และตัวอย่างมีอุณหภูมิเดียวกัน) โดยเฉพาะอย่างยิ่ง การวัดแบล็คกราวน์ควรวัดเทียบกับอากาศ (หรือก๊าซไนโตรเจน) หรือเทียบกับวัสดุอ้างอิงที่ไม่แสดงแถบการดูดกลืนในช่วงสเปกตรัมที่เกี่ยวข้อง
F. ความสำคัญของพารามิเตอร์ที่วัดและค่าอ้างอิง (The Importance of Measurement Parameters and Reference Values)
ในการวิเคราะห์สเปกตรัมของ FT-NIR และราแมน (Raman) จำนวนจุดข้อมูลสเปกตรัมจะมีมากกว่า จำนวนองค์ประกอบทางเคมีมาก ค่าองค์ประกอบทุกชนิดจึงไม่เกี่ยวข้องกับจุดสเปกตรัมหนึ่ง (เช่นเดียวกับกรณีการคาลิเบรชั่นแบบตัวแปรเดียว) แต่เกี่ยวกับสเปกตรัมทั้งเส้น ระบบจึงมีข้อมูลอยู่จำนวนมากกว่ามาก ดังนั้น มันเป็นไปได้สำหรับอัลกอริธึม PLS ที่จะชดเชย (ถึงระดับหนึ่ง) ต่อความแปรปรวนทางสถิติของชุดข้อมูลคาลิเบรชั่น แต่มันก็ยังเป็นที่ชัดเจนว่าแบบจำลองที่แน่นอนไม่สามารถได้มาจากชุดข้อมูลที่ไม่เพียงพอ เพราะฉะนั้น คุณภาพของสเปกโทรมิเตอร์มีผลกระทบต่อคุณภาพของแบบจำลองที่สร้างขึ้น (เช่นความละเอียด ความเสถียร อัตราส่วนสัญญาณต่อสิ่งรบกวน และโดยเฉพาะอย่างยิ่งความแม่นยำของการวัด) ความสำคัญในบริบทนี้ คือ คุณภาพของของข้อมูลอ้างอิงและความระมัดระวังในการเตรียมตัวอย่าง จากประสบการณ์ แสดงให้เห็นว่าในกรณีส่วนใหญ่แบบจำลองเคโมเมทริกที่ไม่ดี จะได้จากเทคนิคการวัดค่าอ้างอิงที่ไม่แม่นยำเพียงพอ และจากการเตรียมตัวอย่างที่ไม่ดี มันชัดเจนดังตัวอย่างเช่นการแปรปรวนของอุณหภูมิของตัวอย่างระหว่างการวัด หรือการศึกษาเกี่ยวกับตัวอย่างที่มีเนื้อไม่สม่ำเสมอหรือไม่บริสุทธิ์ อาจนำไปสู่ความผิดพลาดอย่างวิกฤตในการวิเคราะห์ ถ้าหากไม่คำนึงถึงในวิธีการ ค่าความผิดพลาดของการวัดของสเปกโตรมิเตอร์หรือความไม่แม่นยำที่เกี่ยวข้องกับแบบจำลอง PLS มักจะเป็นสิ่งสำคัญที่ถูกละเลย ดังนั้นมันจึงเป็นสิ่งที่จะต้องคำนึงถึงเป็นเบื้องต้น เช่นเดียวกับวิธีอ้างอิง (วิธีทางวัดจริง) ที่เชื่อถือได้ซึ่งจะนำไปสู่การวิเคราะห์ที่มีคุณภาพ ถ้าคุณภาพของข้อมูลอ้างอิงยากหรือเป็นไปไม่ได้ที่จะปรับปรุง มีข้อแนะนำว่าควรวัดตัวอย่างหนึ่งๆหลายๆซ้ำแล้วหาค่าเฉลี่ยซึ่งความแปรปรวนทางสถิติจะถูกเฉลี่ยและค่านอกกลุ่ม (outlier) ที่มีอยู่จะมีผลน้อยลงมากต่อคุณภาพของการวิเคราะห์ สิ่งนี้เป็นความจริงสำหรับการวิเคราะห์แบบสเปกโทรเมทริก ซึ่งกรณีที่วิกฤต ความผิดพลาดสามารถทำให้น้อยลงได้โดยการวัดซ้ำและหาค่าเฉลี่ย
G. การเลือกบล็อกของชุดข้อมูลสเปกตรัม (Selecting the Spectral Data Block)
โดยหลักการ ไม่มีข้อจำกัดในการเลือกบล็อกของชุดข้อมูลสเปกตรัมสำหรับการคาลิเบรชั่นแบบ PLS การเลือกสามารถทำได้โดยการใช้อินเตอร์เฟอโรแกรม (Interferograms) สเปกตรัมแบบช่องสัญญาณเดียว (Single channel spectra) สเปกตรัมแบบส่องผ่าน (Transmission spectra) และอื่นๆ ในหลายๆกรณีแนะนำให้ใช้สเปกตรัมแบบดูดซับ (Absobance spectra) ตราบใดที่สามารถใช้กฎเบียร์-แลมเบิรต์ สเปกตรัมแบบดูดซับมีข้อดีที่สามารถแสดงความสัมพันธ์โดยตรงระหว่างค่าดูดซับกับความเข้มข้น ซึ่งความสัมพันธ์เชิงเส้นแบบนี้จะมีประโยชน์ต่อการคำนวณแฟคเตอร์ในขั้นตอนของ PLS (PLS–algorithm factorization)
H. การเลือกการพิสูจน์แบบภายในหรือภายนอก(Selecting Internal or External Validation)
แบบจำลองเคโมเมตริกสร้างขึ้นจากข้อมูลชุดคาลิเบรชั่น แล้วถูกทดสอบคุณภาพโดยใช้สเปกตรัมของชุดทดสอบ มีวิธีการพิสูจน์ 2 วิธี คือ การพิสูจน์ภายใน (Internal หรือ Cross validation) หรือ การพิสูจน์ภายนอก (External หรือ Test set validation)
การพิสูจน์แบบชุดทดสอบ (Test set validation) สำหรับการพิสูจน์แบบชุดทดสอบนั้นจะใช้กลุ่มตัวอย่างที่เป็นอิสระต่อกัน 2 กลุ่ม โดยกลุ่มแรกคือกลุ่มสำหรับการทำคาลิเบรชั่น (สร้างแบบจำลอง) ส่วนตัวอย่างที่เหลือ (กลุ่มที่2) ใช้สำหรับการพิสูจน์แบบจำลอง ทั้งสองกลุ่มควรจะประกอบด้วยจำนวนตัวอย่างที่ใกล้เคียงกัน และแต่ละกลุ่มควรจะครอบคลุมช่วงของความเข้มข้นของข้อมูลอย่างสม่ำเสมอ
การพิสูจน์แบบไขว้ (Cross Validation) ถ้ามีจำนวนตัวอย่างจำนวนจำกัด (50 ตัวอย่างหรือน้อยกว่า) ไม่ควรแยกชุดทดสอบ (Test set) การพิสูจน์แบบไขว้เท่านั้นที่สามารถทำการทำนายได้อย่างน่าเชื่อถือซึ่งเกี่ยวข้องกับคุณภาพของแบบจำลอง
ในทางปฏิบัติ จะทำการพิสูจน์แบบไขว้เป็นสิ่งแรกเพื่อประเมินวิธีการ โดยเฉพาะถ้ารับรองได้ว่าสเปกตรัมที่ได้ทำการวัดเป็นตัวแทนของตัวอย่าง การแยกกลุ่มทดสอบ (test set) ก็มีความสมเหตุสมผล ในทางตรงกันข้ามการพิสูจน์แบบชุดทดสอบมีข้อได้เปรียบเมื่อปริมาณข้อมูลมีจำนวนมาก ซึ่งใช้เวลาในการคำนวณน้อยกว่าการพิสูจน์แบบไขว้มาก
ซอฟแวร์ส่วนมากสามารถใช้ในการพิสูจน์ได้ทั้งภายในและภายนอก สิ่งนี้ช่วยให้นักวิเคราะห์ประเมินความครอบคลุม (Robustness) ของวิธีการ ซึ่งสามารถทำตามขั้นตอนดังนี้
ในขั้นตอนแรก (ได้อธิบายไว้ข้างต้น) แบบจำลองที่ดีที่สุดถูกหาโดยการพิสูจน์แบบไขว้ ได้ผลของค่า R2 และ RMSECV ในขั้นตอนที่ 2 กลุ่มของข้อมูลถูกแยกเป็น 2 กลุ่มเท่าๆ กัน และกลุ่มแรกถูกกำหนดเป็นข้อมูลกลุ่มคาลิเบรชั่น และกลุ่มที่ 2 เป็นข้อมูลกลุ่มสำหรับทดสอบ แล้วสร้างแบบจำลอง (วิธีการ) โดยมีพารามิเตอร์ที่อธิบายก่อนหน้านี้ ซึ่งถูกพิสูจน์โดยกลุ่มสำหรับทดสอบ และถูกบันทึกค่า R2 และ RMSEP ในขั้นตอนที่ 3 กลุ่มทดสอบและกลุ่มข้อมูลคาลิเบรชั่นถูกสับเปลี่ยน และตรวจสอบด้วยพารามิเตอร์ของแบบจำลองที่เหมือนกัน (การพิสูจน์แบบชุดทดสอบ ครั้งที่ 2) ผลของค่า R2 และ RMSEP ถูกเปรียบเทียบกับการคำนวณที่เกิดขึ้นจากการพิสูจน์แบบชุดทดสอบ ครั้งที่ 1 และกับการพิสูจน์แบบไขว้ ตารางที่ 5.2 แสดงสิ่งนี้สำหรับความผิดพลาดของการวิเคราะห์
ตารางที่ 5.2 การตรวจสอบความเสถียรของแบบจำลองคาลิเบรชั่น
|
Analysis Error of Cross Validation |
Analysis Error of 1. Test Set Validation |
Analysis Error of 2. Test Set Validation |
Stable Calibration |
0,10 |
0,11 |
0,10 |
Unstable Calibration |
0,10 |
0,25 |
0,33 |
ในกรณีของข้อมูลที่มีขนาดเหมาะสมและเป็นตัวแทน (นี่เป็นสภาวะสำหรับวิธีการที่เสถียรแล้ว) ค่าทั้งหมดจะต้องมีอยู่ในช่วงความเผื่อความผิดพลาดที่น้อย ถ้าความผิดพลาดของการทำนายสำหรับการพิสูจน์แบบไขว้ (cross validation) ดีกว่าการพิสูจน์แบบชุดทดสอบ มันอาจเป็นตัวชี้วัดได้ว่าตัวอย่างที่ใช้ไม่เพียงพอ ผลจากความจริงที่ว่าสำหรับการพิสูจน์แบบไขว้ เมื่อเปรียบเทียบกับการพิสูจน์แบบชุดทดสอบ โดยประมาณ จะมีจำนวนตัวอย่าง 2 เท่าของตัวอย่างที่มีถูกรวมอยู่ในชุดคาลิเบรชั่น ถ้าจำนวนตัวอย่างไม่เพียงพอ มันจะมีผลอย่างยิ่งต่อการพิสูจน์แบบชุดทดสอบ เนื่องจากการลดจำนวนตัวอย่างของชุดคาลิเบรชั่น
ในทางตรงกันข้าม ถ้าชุดข้อมูลมีจำนวนมากเพียงพอ การแบ่งครึ่งจำนวนของชุดคาลิเบรชั่น ก็น่าจะทำให้เกิดความผิดพลาดของการวิเคราะห์คล้ายๆกัน ถ้าในกรณีนี้ สามารถสมมุติว่าการคาลิเบรชั่นจะครอบคลุมสภาวะในอนาคต นอกจากนี้ คำแนะนำโดยทั่วไปเพื่อหาวิธีการที่เหมาะสมทำโดยการพิสูจน์แบบชุดทดสอบครั้งที่ 1 แล้วตรวจสอบความครอบคลุมด้วยการพิสูจน์แบบไขว้และพิสูจน์ชุดทดสอบครั้งที่สอง ถ้ามีกลุ่มของชุดคาลิเบรชั่นและชุดทดสอบหลายกลุ่มขึ้น ก็จะง่ายขึ้นในการพิจารณาว่า การแบ่งครึ่งชุดข้อมูลนำไปสู่การสูญเสียอย่างมีนัยสำคัญของความแม่นยำ (Precision) ของการวิเคราะห์และการเพิ่มจำนวนตัวอย่างเป็นสิ่งจำเป็น
โดยไม่คำนึงถึงชนิดของการพิสูจน์ ต้องใส่ใจที่จะต้องไม่รวมตัวอย่างที่เหมือนกันในชุดคาลิเบรชั่นและในชุดทดสอบ เช่นเดียวกัน ถ้ามีการวัดตัวอย่างเดียวกันหลายครั้ง จะต้องไม่แยกสเปกตรัมเหล่านั้นออกไปในชุดข้อมูลทั้งสองชุด (ดูบทที่ 6: PLS-regression: วิธีที่ทำให้มีความถูกต้องไม่จำกัด)
I. การเลือกช่วงของสเปกตรัม (Selecting Spectral Ranges)
PLS regression เรียกได้ว่าเป็นวิธีการใช้สเปกตรัมทั้งหมดตลอดช่วง นั่นคือยิ่งมีจำนวนจุดข้อมูลสเปกตรัมมากขึ้น จะได้ข้อมูลเชิงสเปกตรัมต่อ 1 องค์ประกอบมากขึ้นและแบบจำลองจะยิ่งดีขึ้น อย่างไรก็ตามมันต้องพิจารณาว่าผลจากการรบกวนเชิงสเปกตรัมแถบของดูดซับขององค์ประกอบที่รบกวน สามารถทำให้คุณภาพของแบบจำลองลดลง ในกรณีเหล่านี้ อัลกอริธึมของ PLS ก็พยายามที่จะนำโครงสร้างของสเปกตรัมส่วนที่ไม่ได้มาจากองค์ประกอบที่ต้องการวิเคราะห์เข้ามาเกี่ยวข้อง และผลการวิเคราะห์จะด้อยลง ทั้งหมดนี้จะแสดงอยู่ในรูปที่ 5.6 เป็นตัวอย่างของสเปกตรัมเนียร์อินฟราเรดของน้ำ (การวัดแบบส่องผ่าน ระยะทางแสงผ่าน (optical path length): 2 mm) สเปกตรัมแสดงการดูดซับที่ระหว่าง 5,200 cm-1ถึง 4,000 cm-1 และที่น้อยกว่า 4,000 cm-1 เป็นการถูกรบกวน (Noise) อย่างรุนแรง ขอบเขตทั้งสองนี้จะต้องไม่ถูกใช้เพื่อสร้างแบบจำลอง
รูปที่ 5.6 สเปกตรัมของน้ำในคิวเวต (ระยะทางแสงผ่าน (optical path length): 2 mm)
ดังนั้นจึงมักจะเป็นประโยชน์ในการวัดตัวอย่างทั้งหมดตลอดช่วงสเปกตรัม แล้วมองหาคุณสมบัติเชิงสเปกตรัมที่ช่วยพัฒนาแบบจำลอง ในบริบทนี้ แถบการดูดซับคลื่นที่มีค่าการดูดซับระหว่าง 0.7 และ 1.0 โดยทั่วไปนำไปสู่การได้ผลดีที่สุด เมื่อใช้ FT-spectrometers ที่ทันสมัย ปกติจะได้ค่าการดูดซับคลื่นสูงถึง 2.5 ซึ่งสามารถนำมาใช้คาลิเบรชั่นแต่ก็จำเป็นที่จะใช้ตัวตรวจวัด (Detector) ซึ่งทำงานเป็นเชิงเส้นตรงตลอดช่วงทั้งหมด (เช่น Peltier-cooled InAs- หรือ InGa-As detectors) สัญญาณขนาดใหญ่ (ค่าการดูดซับคลื่นสูงมากกว่า 2.5) ไม่ควรจะนำมาพิจารณา เนื่องจากจะนำไปสู่ความไม่แน่นอนของการวัดที่สูงขึ้น
อย่างไรก็ตามแนะนำให้ลบกลุ่มสัญญาณอย่างต่อเนื่อง โดยใน IR- NIR- และ Raman-สเปกโทรสโกปีนั้น สสารส่วนใหญ่ (สารที่ยกเว้นมีน้อยมาก) มีสัญญาณในช่วงสเปกตรัมที่กว้าง ดังนั้นการค้นหาโครงสร้างที่ให้ผลโดยปกติแล้วมักจะไม่จำเป็น ตารางที่ 5.3 และ รูปที่ 5.7 แสดงภาพคร่าวๆของช่วงความถี่ที่สังเกตได้ตามปกติในเนียร์อินฟราเรดสเปกโทรสโกปี (ข้อมูลรายละเอียดเพิ่มเติมจะหาได้ที่ภาคผนวก)
ตารางที่ 5.3 สัญญาณการดูดซับคลื่นเนียร์อินฟราเรด
J. การเลือกวิธีการจัดการข้อมูลเบื้องต้น(Selecting the Data Preprocessing Model Method)
นอกเหนือจากการเลือกความถี่ที่ถูกต้องแล้ว วิธีการจัดการข้อมูลเบื้องต้นเป็นพารามิเตอร์ของแบบจำลองที่สำคัญลำดับสอง ที่มีจุดประสงค์เพื่อสร้างแบบจำลองของสเปกตรัมในทางที่อัลกอริธึม PLS สามารถให้ความสัมพันธ์ที่ดีระหว่างสเปกตรัมกับข้อมูลความเข้มข้น
- ไม่มีการจัดการข้อมูลเบื้องต้น: ไม่มีการจัดการข้อมูลเบื้องต้น
- การลบโดยค่าคงที่ (Subtraction of a Constant Offset): สเปกตรัมจะถูกปรับแบบเชิงเส้นเพื่อให้ค่า Y ที่ต่ำสุดมีค่าเท่ากับศูนย์
การใช้งาน: เป็นการกำจัดปัญหาการขยับขึ้นของเบสไลน์ (Baseline Shift) เชิงเส้น สิ่งเหล่านี้เกิดจากเช่น จากค่าที่แตกต่างกันของการขยายสัญญาณของดีเทคเตอร์ (Detector Amplification)
- การลบโดยเส้นตรง (Subtraction of a Straight Line): ในแต่ละช่วงความถี่ที่เลือกไว้ เส้นตรงเส้นหนึ่งจะถูกฟิตเส้นสเปกตรัมโดยใช้วิธีวิธี partial least squares (PLS) เส้นตรงเส้นนี้จะถูกลบออกจากสเปกตรัมดังกล่าว
การใช้งาน: กำจัดปัญหาความเอียงเชิงเส้นของการขยับขึ้นของเบสไลน์ (ดูรูปที่ 5.8)
- Vector Normalization: ขั้นแรกสเปกตรัมจะถูกหาสเปกตรัมกลางจากนั้นผลรวมของค่ายกกำลังสองของค่า Y ทั้งหมดจะถูกคำนวณ และสเปกตรัมใดๆจะถูกหารด้วยค่ารากที่สองของผลรวมนี้ สิ่งที่เรียกว่า vector norm ของสเปกตรัมที่ได้จะเท่ากับ 1เสมอ (ดู Tips from experts: www.nirsresearch.com)
การใช้งาน: ในหลักการ สเปกตรัมจะประกอบด้วยสองส่วนของข้อมูล คือความสูงของแถบการดูดซับและโครงสร้าง หลังจากการนอร์มัลไลเซชั่น (Normalization) ข้อมูลความสูงจะหายไป; มีเพียงโครงสร้างข้อมูลยังคงอยู่ การนอร์มัลไลเซชั่น (Normalization) ถูกใช้เพื่อ เช่นการกำจัดผลกระทบของเส้นทางผ่านเชิงแสง (Optical Path Length) ที่แตกต่างกัน ในกรณีของการวัดแบบส่องผ่าน ความยาวของเส้นทางผ่านเชิงแสงทำให้ความสูงของสัญญาณเปลี่ยนแปลง แต่โครงสร้างยังเหมือนเดิม ในทำนองเดียวกันการวัดแบบสะท้อนแบบแพร่จะมีผลกระทบของการรบกวนเนื่องจากความหนาแน่นของวัสดุแตกต่างกันหรือขนาดอนุภาคแตกต่างกัน สิ่งเหล่านี้ก็จะลดลง
- Min-Max-Normalization (สำหรับสเปกตรัมการดูดซับคลื่น): สเปกตรัมจะถูกขยับเชิงเส้นเพื่อให้ค่า Y ที่ต่ำสุดมีค่าเท่ากับศูนย์แล้วสเปกตรัมจะถูกขยายเพื่อให้ค่า Y สูงสุดเท่ากับสองหน่วยของการดูดซับคลื่น (รูปที่5.8)
การใช้งาน: เทียบได้กับ Vector Normalization
รูปที่ 5.8 NIR สเปกตรัมของมือคน; วัดแบบการสะท้อนแบบแพร่
- Multiplicative Scatter Correction:ขั้นตอนแรก, สเปกตรัมเฉลี่ยคำนวณจากทุกๆสเปกตรัมของชุดข้อมูลคาลิเบรชั่น แล้วแต่ละสเปกตรัม X (i) จะถูกแปรเปลี่ยนไปตาม
X(i)'=u+v.X(i) (5-1)
ค่าสัมประสิทธิ์ u และ v จะถูกเลือกเพื่อให้มีความแตกต่างระหว่างสเปกตรัมที่เปลี่ยนแปลงแล้ว X(i)' กับสเปกตรัมเฉลี่ยน้อยที่สุด
การใช้งาน: วิธีการนี้มักจะใช้สำหรับการวัดแบบการสะท้อนแบบแพร่ (Diffuse reflection)
- อนุพันธ์อันดับที่หนึ่ง (First Derivative):คำนวณอนุพันธ์ลำดับที่หนึ่งของสเปกตรัม (รูปที่ 5.8)
การใช้งาน: โดยการคำนวณอนุพันธ์ลำดับที่หนึ่ง สัญญาณที่มีความชันจะถูกเน้นมากกว่าสัญญาณที่ค่อนข้างแบนราบ วิธีนี้จะถูกใช้เน้นลักษณะที่ชัดเจน แต่มีค่าน้อย เมื่อเทียบกับโครงสร้างที่มีแถบการดูดซับคลื่นที่กว้าง การประยุกต์ใช้ที่สำคัญอีกอย่างหนึ่ง คือ การประเมินแถบการดูดซับคลื่นที่กว้างนี้มักจะทำในเทคโนโลยี NIR โดยการคำนวณอนุพันธ์ โครงสร้างเหล่านี้จะมีรูปร่างที่สูงชันขึ้น ซึ่งสามารถได้รับการประเมินได้ง่ายขึ้น
เมื่อใช้อนุพันธ์เป็นการจัดการข้อมูลเบื้องต้น จะต้องคำนึงถึงว่าสัญญาณรบกวนจะถูกจัดการเช่นกัน สิ่งนี้จะซ้อนทับบนสเปกตรัมเป็นสิ่งรบกวนเพิ่มเติม และสามารถทำให้สัญญาณของตัวอย่างเลวลง
- อนุพันธ์ที่สอง (Second Derivative):คำนวณอนุพันธ์อันดับสองของสเปกตรัมนั้น
การใช้งาน: เมื่อเทียบกับอนุพันธ์อันดับที่หนึ่ง แม้โครงสร้างที่ราบเรียบมากๆสามารถประเมินได้ ผลการรบกวนของสัญญาณรบกวน ซึ่งโดยทั่วไปมีมากจนทำให้สเปกตรัมถูกวิเคราะห์ในช่วงสเปกตรัมที่จำกัดมากๆ
รูปที่ 5.8 แสดงให้เห็นอิทธิพลของวิธีการจัดการข้อมูลเบื้องต้นแบบต่างๆต่อลักษณะของ NIR-สเปกตรัม (การวัดมือคนด้วยหัววัดไฟเบอร์ออปติก) สเปกตรัมเดิมแสดงให้เห็นการขจัด (Offset) เล็กน้อยของเบสไลน์ เช่นเดียวกับการขยับขึ้น (Drift) การขยับขึ้นนี้สามารถถูกกำจัดโดยการลบออกจากเส้นตรง (Subtraction of a Straight Line) (เส้นประ) และการขจัดถูกกำจัดโดยการ Min-Max Normalization (เส้นจุด) อนุพันธ์อันดับที่หนึ่งของเส้นสเปกตรัมเดิม (เส้นประ-จุด) ถูกขยายเพื่อแสดงให้ดูง่ายและขยับขึ้นสู่ตำแหน่งที่ค่าการดูดซับคลื่นสูง สามารถสังเกตเห็นโครงสร้างที่แหลมขึ้นมาได้ชัดเจนเมื่อเปรียบเทียบกับสเปกตรัมเดิม
วิธีที่เหมาะสมที่สุดขึ้นอยู่กับระบบที่จะวิเคราะห์ จากประสบการณ์แสดงให้เห็นว่าในหลายกรณีการลบด้วยเส้นตรง การนอมัลไรเซชั่นสเปกตรัม หรือการทำอนุพันธ์อันดับที่หนึ่งได้ผลที่ดีที่สุดในการคาลิเบรชั่น ในบางกรณีการใช้วิธีการจัดการข้อมูลเบื้องต้น 2 วิธีรวมกันก็ได้ผลดีที่สุดเช่นกัน บ่อยครั้งที่แบบจำลองแบบต่างๆให้ผลได้ดีเท่าเทียมกัน (ดูบทที่ 6) ซึ่งโดยทั่วไปควรทดสอบดูหลายๆวิธีเปรียบเทียบกัน
K. การเลือกจำนวนแฟคเตอร์ที่เหมาะสม (Selecting the Appropriate Number of Factors)
ใน PLS regression ข้อมูลสเปกตรัมและข้อมูลความเข้มข้นจะถูกเปลี่ยนแปลงเป็นรูปแบบของเมทริกซ์และลดลงเป็นแฟคเตอร์จำนวนไม่มาก จำนวนแฟคเตอร์ ในแบบจำลองเคโมเมตริกจะถูกเรียกว่า “rank” การหาจำนวน rank มีความสำคัญกับคุณภาพในการวิเคราะห์
การเลือกจำนวนแฟคเตอร์ที่น้อยเกินไปจะนำไปสู่การอธิบายที่ไม่เพียงพอเกี่ยวกับการเปลี่ยนแปลงในข้อมูลสเปกตรัมและความเข้มข้น (“under fitting”) มีเพียงความสัมพันธ์เพียงเล็กน้อย ระหว่างสองชุดข้อมูลและผลจากการวิเคราะห์จากแบบจำลองนี้จะไม่เพียงพอ ถ้าเลือกแฟคเตอร์จำนวนมากเกินไปแบบจำลองจะพยายามที่จะคิดรวมแม้การเปลี่ยนแปลงน้อยที่สุดในชุดข้อมูลเช่นสัญญาณรบกวนในสเปกตรัม (“over fitting”) วิธีนี้ข้อมูลสเปกตรัมที่ไม่เกี่ยวข้องกับตัวอย่างจะถูกรวมอยู่ในแบบจำลอง แบบจำลองเหล่านี้จะมีความผิดพลาดของผลการวิเคราะห์ ดังนั้นทุกๆแบบจำลอง PLS มีจำนวนแฟคเตอร์ที่เหมาะสมซึ่งรับประกันว่ามีความผิดพลาดน้อยที่สุดที่เป็นไปได้ในการวิเคราะห์
มีแนวทางหลายอย่างที่นำไปสู่การหาจำนวนเฟคเตอร์ที่เหมาะสมสำหรับแบบจำลอง บางอย่างเป็นค่าเฉลี่ยของความผิดพลาดของการทำนาย (RMSECV ของการพิสูจน์แบบไขว้และ / หรือ RMSEP ของการพิสูจน์แบบชุดทดสอบ) ต้องมีค่าต่ำสุดจึงจะได้จำนวนแฟคเตอร์ที่เหมาะสม ในทางตรงข้ามค่าของสัมประสิทธิ์ของการพิจารณา R2 มีค่าสูงสุด ดังนั้นจำนวนแฟคเตอร์ที่เหมาะสมสำหรับแบบจำลองสามารถหาได้อย่างง่ายดาย: ขั้นที่ 1 คำนวณค่า R2 และค่าความผิดพลาดเฉลี่ยของการทำนาย จากนั้นพล็อตค่าเหล่านี้โดยให้แกนนอนเป็นจำนวนแฟคเตอร์ จำนวนแฟคเตอร์ที่เหมาะสมเมื่อมีค่าตามที่กล่าวมามีค่าที่เหมาะสม (น้อยสุด) และ / หรือจะไม่เปลี่ยนแปลงอย่างมีนัยสำคัญเมื่อมีจำนวนแฟคเตอร์สูงขึ้น ถ้ามีจำนวนแฟคเตอร์ที่มากและได้ผลการทำนายที่ดีเหมือนๆกับที่มีจำนวนแฟคเตอร์น้อย จะแนะนำให้เลือกแบบจำลองที่มีจำนวนแฟคเตอร์น้อยสุด (ดูบทที่ 6)
ข้อควรระวัง: การพิสูจน์วิธีการเป็นไปได้เฉพาะการใช้สเปกตรัมของชุดตัวอย่างที่เป็นอิสระนั่นคือสเปกตรัมต้องไม่เป็นส่วนหนึ่งของชุดข้อมูลคาลิเบรชั่น ซึ่งถ้าเป็นการพิสูจน์แบบไขว้ตัวอย่างทั้งหมดที่ถูกวัดแต่ละตัวอย่างจะถูกดึงออกจากชุดคาลิเบรชั่น “leave-out spectra” ในกรณีของการพิสูจน์แบบชุดทดสอบตัวอย่างใหม่จะถูกวัดเพื่อเป็นชุดทดสอบ
L. การเลือกตัวอย่างชุดคาลิเบรชั่นที่เหมาะสม; การระบุและการกำจัดค่าผิดปกติ (Selecting Suitable Calibration Samples; Recognizing and Eliminating Outliers)
ถ้าชุดข้อมูลคาลิเบรชั่นมีค่าผิดปกติ จะสามารถระบุได้อย่างง่ายหลังจากทำการพิสูจน์ ค่าผิดปกติจะแสดงโดย เช่น
- มีส่วนที่ค่าความผิดพลาดเชิงสเปกตรัม (Spectral residuum) ที่มีค่าสูง
- มีค่า F-value มาก
- ค่า FProb เท่ากับ 0.99 หรือมากกว่า
- ข้อผิดพลาดในการวิเคราะห์ค่อนข้างมาก ซึ่งสามารถเห็นได้จากค่าที่ต่างกันสูง (ค่านี้แสดงให้เห็นถึงความแตกต่างระหว่างค่าอ้างอิงและค่าการวิเคราะห์ (ด้วย NIRS))
ในกรณีส่วนใหญ่ มันจะเป็นประโยชน์ที่จะเปรียบเทียบค่าอ้างอิงกับค่าการวิเคราะห์โดยใช้กราฟ ค่าผิดปกติแสดงระยะห่างจากค่าอ้างอิงมาก หลังจากลบค่าผิดปกติจากชุดข้อมูลคาลิเบรชั่น แบบจำลองใหม่สามารถถูกสร้างขึ้นได้ การพิสูจน์ควรจะไม่มีค่าผิดปกติอีกต่อไป สำหรับชุดข้อมูลที่สำคัญ มันเป็นไปได้ว่าหลังจากที่กำจัดค่าผิดปกติชุดแรกแบบจำลองนี้ก็ยังไม่ดีที่สุด เป็นกรณีที่ถ้าจำนวนค่าผิดปกติสูงจนส่งผลกระทบต่อแบบจำลองอย่างเห็นได้ชัด ดังนั้น แบบจำลองจะต้องปรับให้เหมาะสม ทีละขั้นตอนโดยการกำจัดค่าความผิดปกติ
ข้อควรระวัง อย่างไรก็ตาม มันเป็นสิ่งจำเป็นที่จะตรวจสอบอย่างวิกฤติว่า ค่าผิดปกติเกิดจากการวัดที่ผิดพลาดหรือไม่ การกำจัดตัวอย่างที่ปกติ แต่ไม่ชอบ “เป็นสิ่งที่ทำไม่ได้” แบบจำลองคาลิเบรชั่นจะขาดความเสถียรที่เพียงพอ ที่จะจัดการความแตกต่างทางธรรมชาติของตัวอย่างต่างๆ
โดยปกติตัวอย่างจะถูกทำเครื่องหมายให้เป็นค่าผิดปกติ จะอยู่ไกลจากช่วงปกติของชุดคาลิเบรชั่น ในกรณีนี้ อย่างไรก็ตาม สาเหตุสำคัญในการระบุค่าผิดปกติไม่ใช่การวัดค่าผิดพลาด แต่เป็นการขาดความครอบคลุมสภาวะที่เป็นจริง (Robustness) จึงเป็นหน้าที่ของนักวิเคราะห์ในการสร้างการกระจายของค่าองค์ประกอบในช่วงทั้งหมดอย่างสม่ำเสมอ โดยการวัดตัวอย่างเพิ่มเติมแทนที่จะกำจัดค่าที่มีอยู่ไม่กี่ค่า และไม่ควรไว้ใจการระบุค่าผิดปกติในรายงานการพิสูจน์โดยไม่เข้าใจและกำจัดตัวอย่างที่ถูกระบุนั้นออกไปโดยง่าย โดยทั่วไปซอฟแวร์ทางเคโมเมทริกสามารถวัดความน่าเชื่อถือของค่า โดยมีพื้นฐานของค่าพารามิเตอร์ทางสถิติเท่านั้น จะเห็นได้อย่างชัดเจนว่า ถ้าเพียงแต่คิดค่าเหล่านี้โดยไม่มีความรู้ใดๆ เกี่ยวกับการประยุกต์ใช้ที่สอดคล้องกัน มันจะเป็นไปไม่ได้เลยที่จะตัดสินว่า สเปกตรัมนั้นๆ จะเป็นสเปกตรัมนอกกลุ่ม(ผิดปกติ) (Outlier) จริงๆ ดังนั้นเพียงผู้วิเคราะห์เท่านั้นจะสามารถตัดสินใจบนพื้นฐานของการพิจารณาสเปกตรัมนั้นอย่างเป็นอิสระ ว่าค่านี้ต้องปฏิเสธจริงๆหรือไม่สำหรับการประยุกต์ใช้งานเฉพาะ
M. การประเมินผลการพิสูจน์ (Evaluating the Validation Results)
งานที่สำคัญที่สุดอย่างหนึ่งของผู้พัฒนาแบบจำลอง คือ การพิจารณาความเป็นประโยชน์ของชุดข้อมูล วิธีที่ง่ายที่สุดที่จะพิสูจน์ความน่าเชื่อถือของชุดข้อมูล คือการวัดตัวอย่างต่างๆหลายๆครั้ง แล้วพล๊อตค่าจริงกับค่าทำนาย ในกรณีที่เป็นอุดมคติค่าวัดจริงและค่าทำนายของทุกๆการวัดจะเหมือนกันภายในพิกัดความผิดพลาดที่กำหนดไว้
อย่างไรก็ดี สิ่งนี้ไม่สามารถประยุกต์ใช้กับทุกๆแบบจำลองคาลิเบรชั่น ในบางกรณีค่าความผิดพลาดเฉลี่ยของการทำนาย (RMSECV หรือ RMSEP) อาจไม่มีคุณภาพตามต้องการ จึงเป็นหน้าที่ของผู้วิเคราะห์ที่จะหาคำอธิบายเกี่ยวกับผลที่ได้และที่จะหาวิธีการวัดที่เหมาะสม เพื่อที่จะปรับปรุงผล ถ้าเป็นไปไม่ได้ จำเป็นที่จะต้องตระหนักโดยเร็วว่า วิธีการที่เลือกไว้ไม่เหมาะสมกับการวิเคราะห์ตัวอย่างให้มีความแม่นยำเพียงพอ และ ดังนั้นจึงไม่สามารถที่จะทำอะไรต่อไปได้ซึ่งจะอธิบายโดยยกตัวอย่างต่อไปนี้ 2 ตัวอย่าง
รูปที่ 5.9 แสดงการเปรียบเทียบค่าจากการวัดจริงและค่าทำนายของ 2 แบบจำลองซึ่งมีความแม่นยำไม่ดีพอ
แต่ละตัวอย่างถูกวัด 3 ซ้ำ โดยทั่วไปแต่ละจุดมีระยะห่างจากเส้นกึ่งกลาง (Bisector) มาก อย่างไรก็ตามรูปในด้านซ้ายมือแสดงการวัดในแต่ละตัวอย่างมีความถูกต้องสูง แต่ละจุดของตัวอย่างแสดงระยะห่างจากเส้นตรงโดยประมาณที่เท่าๆ กัน อีกนัยหนึ่งกล่าวได้ว่า การวัดผิดพลาด (Wrong) แต่แม่นยำ (Precise) สิ่งเหล่านี้นำไปสู่การสรุปได้ว่า ขั้นตอนการวิเคราะห์ควรต้องเหมาะสมเพื่อแก้ไขการวัด สาเหตุสำหรับความบกพร่องของความไม่ถูกต้องอาจอยู่ที่ปัจจัยอื่นๆ
ยกตัวอย่างเช่นการกระจายทางสถิติของค่าที่ทำการวิเคราะห์เทียบกับค่าจริงเกิดจากการวัดด้วยวิธีอ้างอิงที่ไม่เที่ยงตรงหรือโดยการปลอมปนจากการเตรียมตัวอย่าง ในทางตรงกันข้าม การวัดที่อุณหภูมิแตกต่างหรือการใช้การตั้งค่าการวัดที่แตกต่างก็เป็นสาเหตุของความผิดพลาดที่เกิดขึ้นกับระบบ สิ่งเหล่านี้ทำให้แต่ละจุดโดยรวมจะอยู่เหนือและต่ำกว่าเส้นตรงในรูปที่ 5.9 นอกจากนั้นวิธีเคโมเมทริกซ์ที่ไม่สมบูรณ์สามารถนำไปสู่ผลเช่นนี้ ยกตัวอย่างเช่น สารประกอบที่มีองค์ประกอบที่หลากหลายและซับซ้อน ต้องการมาตรฐานการคาลิเบรชั่นที่เป็นตัวแทนจำนวนมาก ถ้าสิ่งนี้ไม่ถูกวัดในจำนวนที่เพียงพอ อัลกอริธึมก็ไม่สามารถที่จะกำหนดโครงสร้างเฉพาะของสารที่ต้องการวัดในสเปกตรัมอย่างเหมาะสมกับองค์ประกอบนั้น ดังนั้นการวิเคราะห์ตัวอย่างใหม่ที่ไม่ทราบค่าจะนำไปสู่ความแม่นยำแต่เป็นการวิเคราะห์ที่ผิด จึงต้องเพิ่มจำนวนสเปกตรัมให้มากขึ้นในการสร้างแบบจำลอง
ในหลายๆกรณี สาเหตุการได้ผลที่เลวของการวิเคราะห์สามารถพบเจอได้ง่าย ถ้าค่าการวัดในแต่ละครั้งจะแสดงได้อย่างแม่นยำพร้อมกับการวิเคราะห์ NIRS มันเป็นเรื่องที่วิกฤตมาก ถ้าจุดแต่ละจุดแสดงการกระจายของค่าทางสถิติที่กว้าง (รูปขวาของรูปที่ 5.9) ดังนั้นค่าที่ถูกคำนวณไม่เพียงแต่จะผิด แต่ไม่สามารถทำซ้ำได้ (not reproducible) โดยปกติการเตรียมตัวอย่างที่ไม่เหมาะสมจะได้รับผลที่ไม่ดี ตัวอย่างเช่น การวัดตัวอย่างที่หลากหลาย (heterogeneous sample) ถ้าวัสดุไม่เป็นเนื้อเดียวกัน หรือถ้าจุดที่วัดเล็กเกินไป ก็จะได้ค่าที่ไม่ถูกต้อง ถึงแม้จะวัดในจุดที่ถูกต้องก็ตาม นี่จะต้องพิจารณาในระหว่างการประเมินผล ถึงแม้ว่าถ้าค่าของการวัดไม่สามารถปรับปรุงให้เหมาะสมได้ มีข้อแนะนำให้เพิ่มจำนวนของตัวอย่างในการทำแบบจำลองคาลิเบรชั่น ถ้ายังไม่สามารถปรับปรุงความถูกต้องในการทำนายได้มากขึ้น ก็แสดงว่าวิธีที่วิเคราะห์ (NIRS) ที่เลือกนั้นไม่เหมาะสม
N. การนำแบบจำลองไปใช้และการบำรุงรักษา (Implementation and Maintenance of Methods)
แน่นอนว่าสิ่งที่สำคัญที่สุดของผู้พัฒนาวิธีการคือ การรวบรวมชุดข้อมูลคาลิเบรชั่นที่เป็นตัวแทน และการพิจารณาสิ่งรบกวนที่เป็นไปได้ต่อการวัดหรืออุปกรณ์ ซึ่งโดยปกติต้องมีความชำนาญในการวิเคราะห์ เนื่องจากไม่เพียงแต่ตัวอย่างเท่านั้นที่จะถูกตรวจสอบ (และหรือกระบวนการซึ่งสามารถตรวจสอบได้) ให้เข้าใจ แต่ยังจะต้องเข้าใจเทคนิคของการประเมินค่าและการวัดด้วย ดังนั้นทุกบริษัทจะต้องมีผู้ชำนาญในการรวบรวมและบำรุงรักษาแบบจำลอง ในหลายๆโรงงานจะต้องมีบริษัทจากภายนอกมานำเสนอบริการการคาลิเบรชั่นที่มีคุณภาพ นอกเหนือจากการคาลิเบรชั่นที่เกิดขึ้นจริง พวกเขาควรจะให้ค่าประเมินความถูกต้องที่คาดไว้ของแบบจำลองในบริบทเกี่ยวกับการศึกษาความเป็นไปได้ เช่นเดียวกันกับการบำรุงรักษาแบบจำลองอย่างเป็นระบบ ควรจะถูกนำเสนอ เช่น ตามข้อตกลงในการบริการ
โดยปกติมักจะแนะนำให้พิจารณาความน่าเชื่อถือของวิธีเคโมเมทริกเป็นระยะ ซึ่งสามารถทำอย่างง่ายๆโดยวัดความน่าเชื่อถือของแบบจำลองด้วยชุดตัวอย่างทดสอบอิสระเป็นระยะสม่ำเสมอ (เช่น ทุกๆกี่เดือน ทุกๆกี่รอบการผลิต หรือหลังจากการวัดกี่ครั้ง เป็นต้น) ในบางอุตสาหกรรม เช่นอุตสาหกรรมยา ข้อแนะนำขั้นตอนที่เหมาะสม ทำให้ผู้ใช้ต้องทำการตรวจสอบอย่างสม่ำเสมอ (ยาเม็ดหนึ่งจะสามารถถูกอนุญาตให้ขายได้ ถ้ามีใบรับรองผลการวิเคราะห์)
แต่แม้แต่ว่าถ้าไม่มีกฎเกณฑ์ที่เหมาะสม ก็ควรจะมีการสังเกตและบำรุงรักษาแบบจำลอง มันสามารถถูกสังเกตบ่อยๆว่าแม้ว่าแบบจำลองจะมีประโยชน์ในระยะแรก แต่จะค่อยๆให้ผลที่เลวลงทีละน้อย โดยมีเหตุผลหลายอย่าง อย่างแรกคือ การเปลี่ยนแปลงของเครื่องมือทีละเล็กทีละน้อย (และการเปลี่ยนแปลงของคิวเวต หัววัด และใยแก้วนำแสง) นอกจากนี้แล้วการเปลี่ยนสภาวะของบริเวณที่วัดหรือคุณภาพของวัตถุดิบที่แตกต่างก็มีผลต่อคุณภาพของการวิเคราะห์ โดยเฉพาะอย่างยิ่งการสร้างแบบจำลองของวัสดุที่เป็นทางธรรมชาติหรือวัตถุดิบทางปิโตรเคมี ทำให้การบำรุงรักษาวิธีการมีความจำเป็นในช่วงเวลานาน
สำหรับการประยุกต์ใช้งานต่างๆ มันมีความสำคัญว่าการลดคุณภาพของการวิเคราะห์อย่างช้าๆ ต้องถูกรับรู้ในระยะแรก ปัญหาใหม่ๆของการวิเคราะห์หรือเทคโนโลยีของกระบวนการจะไม่ยอมให้สามารถปรับปรุงแบบจำลอง เมื่อมันได้สูญเสียความเป็นประโยชน์สำหรับงานที่ได้รับ การบำรุงรักษาแบบจำลองควรเป็นกระบวนการต่อเนื่องในการวิเคราะห์ประจำวัน
ถ้าผู้พัฒนาแบบจำลองเชื่อว่ามีตัวอย่างชุดทดสอบจำนวนหนึ่งไม่ได้ถูกวิเคราะห์อย่างถูกต้อง ขั้นตอนแรกมันสำคัญที่จะทบทวนและเปรียบเทียบสเปกตรัมกับของชุดคาลิเบรชั่นในตอนแรก ส่วนมากเหตุผลสำหรับข้อมูลที่ผิดปกติ สามารถค้นพบได้อย่างรวดเร็ว เมื่อเหตุผลนั้นได้รับการเข้าใจแล้ว กลยุทธ์ที่เหมาะสมสามารถถูกพัฒนาขึ้นเพื่อเพิ่มจำนวนตัวอย่างด้วยตัวอย่างที่เหมาะสม มันควรจะระบุในที่นี้ว่ามันไม่มีเหตุผลที่จะเพิ่มสเปกตรัมใหม่ๆเข้าไปในชุดข้อมูลอย่างต่อเนื่อง โดยปราศจากการตรวจสอบมาก่อน สิ่งที่เป็นอันตรายคือ ข้อมูลเพื่อให้วิธีการมีเสถียรภาพไม่รวมอยู่ในตัวอย่างเหล่านี้ ซึ่งชุดข้อมูลขนาดใหญ่จะถูกสร้างขึ้นซึ่งเป็นกลุ่มที่ไม่ใช่ตัวแทน ปัญหาต่อไปที่เรามักจะพบในกระบวนการวิเคราะห์ก็คือความเป็นไปไม่ได้ที่จะเลียนแบบสภาวะของกระบวนการจริงในห้องปฏิบัติการ นอกจากนี้การนำตัวอย่างและวิเคราะห์ด้วยวิธีการอ้างอิงมักจะเป็นไปไม่ได้ หรือพูดอีกอย่างหนึ่งว่า มันเป็นไปไม่ได้ที่จะเก็บตัวอย่างชุดคาลิเบรชั่นที่เป็นตัวแทน ในที่นี้มันมักจะเป็นประโยชน์ที่จะเก็บตัวอย่างก่อนแล้วจึงสรุปผลสำหรับค่านั้นของกระบวนการจากผลของการวิเคราะห์ประจำ (Routine analysis) ที่กำหนดขึ้น ถ้าเป็นไปไม่ได้จะต้องมีความรู้เกี่ยวกับวิธีการที่จำกัดอย่างยิ่งซึ่งสามารถทำงานเป็นผู้ตรวจสอบกระบวนการที่จะระบุว่า “Process OK” หรือ “Process not OK” บางครั้งวิธีการที่ไม่ถาวรซึ่งจัดสร้างขึ้นในห้องปฏิบัติการจะต้องนำมาให้ซึ่งผลที่ไม่แม่นยำ แต่จะสะท้อนการดำเนินไปของปฏิกิริยาได้อย่างถูกต้อง การตัดสินใจของนักวิเคราะห์ที่มีคุณภาพเป็นสิ่งจำเป็นในการพิจารณาว่าถ้าวิธีการที่กำหนดไว้เหมาะสมกับความต้องการของกระบวนการ
30 กันยายน 2561
ผู้ชม 2352 ครั้ง