01 背景
拉曼技術(shù)在生物工藝開發(fā)中的應(yīng)用已經(jīng)顯示出其在培養(yǎng)工藝和過程監(jiān)測的巨大潛力。但在生物工藝開發(fā)過程中,當(dāng)克隆、培養(yǎng)基或培養(yǎng)規(guī)模等條件發(fā)生變化時,拉曼技術(shù)的性能仍面臨一些挑戰(zhàn)和限制。本研究提出了一種在線拉曼光譜分析儀實用的PAT(過程分析技術(shù))監(jiān)測方法,既可用于開發(fā)階段,也可用于生產(chǎn)階段,以平衡生物工藝開發(fā)過程中多個哺乳動物細胞培養(yǎng)過程中產(chǎn)生的不同結(jié)果。將風(fēng)險評估技術(shù)與開發(fā)監(jiān)測定標(biāo)(局部模型或一般模型)的兩種方法相結(jié)合,當(dāng)多種培養(yǎng)條件發(fā)生變化時,我們能夠從作為PAT工具的拉曼光譜中獲得良好的預(yù)測能力。本篇文章使用四種不同類型的CHO細胞、八種不同的克隆和四種不同的規(guī)模(2升、7升、15升和10000升),在兩種培養(yǎng)模式(分批培養(yǎng)和灌流培養(yǎng))下進行了35次培養(yǎng),在生物工藝開發(fā)的同時使用拉曼在線生物工藝分析儀最好地開發(fā)PAT方法提供參考。
02 介紹
過程分析技術(shù)(PAT)于2004年由美國食品藥品管理局(FDA)發(fā)起。新一代基于過程分析技術(shù)的制藥研發(fā)和生產(chǎn)程序允許從中間體和最終產(chǎn)品的抽樣檢測質(zhì)量轉(zhuǎn)向基于對材料屬性、過程參數(shù)和產(chǎn)品質(zhì)量屬性之間關(guān)系的正確理解的設(shè)計質(zhì)量(QbD)。PAT在生物制藥領(lǐng)域的發(fā)展緩慢而穩(wěn)定主要有以下幾個原因:缺乏具有必要靈敏度和特異性的PAT工具來區(qū)分主產(chǎn)品和多種副產(chǎn)品;由于基于細胞的過程會產(chǎn)生多組分基質(zhì),光譜選擇性降低;在標(biāo)稱培養(yǎng)條件下,不同時間和不同屬性之間的自相關(guān)性較高。由于拉曼技術(shù)具有采集速度快、無創(chuàng)傷、無試劑、精確度高和單個樣品成本低等特點,因此在監(jiān)測生物過程(特別是上游過程)方面?zhèn)涫荜P(guān)注。與需要人工取樣的傳統(tǒng)參考分析方法相比,原位在線拉曼光譜具有多種優(yōu)勢。拉曼光譜是一種非常強大的PAT工具,在適當(dāng)校準(zhǔn)的情況下,可提供近乎實時的過程狀態(tài)估計。在過去十年中,許多研究將拉曼光譜定位為生物制藥加工過程(即以卵巢細胞(CHO)為平臺的單克隆抗體(mAb))的適用PAT工具。其中一些研究側(cè)重于拉曼光譜和反饋控制策略,另一些研究則證明了拉曼光譜在監(jiān)控從研發(fā)到生產(chǎn)的不同培養(yǎng)條件和規(guī)模方面的可行性。近期研究表明,使用選擇方法并將拉曼光譜區(qū)域分配給特定的分析物,同時進行成分加標(biāo)研究,可以提高模型的預(yù)測能力。
本研究旨在為在工藝開發(fā)階段評估影響校準(zhǔn)模型開發(fā)的主要因素奠定基礎(chǔ)。它還有助于引入最佳實踐,將可靠性納入PAT監(jiān)測方法,使其成為離線參考分析方法的可行替代方法。最終目的是通過使用PAT方法及其工藝監(jiān)測強化,縮短開培養(yǎng)時間,同時從產(chǎn)品發(fā)布開始就提供穩(wěn)健的工藝。因此,我們將研究不同工藝參數(shù)和培養(yǎng)條件對拉曼光譜模型性能的影響。我們建議采用基于風(fēng)險優(yōu)先級數(shù)(RPN)的風(fēng)險策略,對影響拉曼光譜性能的不同變化源進行排序和選擇。選定的變化源,即批次條件,也將通過使用多變量統(tǒng)計過程監(jiān)控來測試其對拉曼光譜數(shù)據(jù)的影響。針對葡萄糖、乳酸鹽和蛋白質(zhì)濃度這三種關(guān)鍵分析物,在每一批次條件下比較非特定通用模型和小型特定模型生成的模型統(tǒng)計參數(shù),然后進行評估。
03 在線拉曼光譜分析儀測試材料和方法
3.1 實驗配置
本研究采用4種不同類型的CHO細胞系、8個不同的克隆、4種不同的規(guī)模(2L、7L、15L和10000L),在標(biāo)稱操作條件(NOC)下分批補料和灌注兩種培養(yǎng)模式進行35次培養(yǎng)。表1總結(jié)了可用的批次,參考了它們各自的條件(探索了八種不同的批次條件或因素)。這些用于標(biāo)記每個批次的光譜數(shù)據(jù)。
較小的生物反應(yīng)器(最多15升)是玻璃容器(Applikon Biotechnology,荷蘭),而生產(chǎn)10000升的生物反應(yīng)器是不銹鋼容器。所有儀器都配備了pH值、溫度、溶解氧探針和拉曼探針。使用Kaiser Raman Rxn2 (Kaiser Optical Systems, USA)儀器。拉曼系統(tǒng)配備785 nm激發(fā)激光系統(tǒng)和四個浸沒探針,長度分別為120mm(10000L容器),220mm(2L容器)和420mm(7和15L容器)。光譜采集范圍為400-1800cm−1,掃描75次,每次掃描10s。大約每天從每個反應(yīng)器中抽取一次樣本進行參考分析。葡萄糖和乳酸使用NOVA Biomedical (Massachusetts, USA)的BioProfile FLEX進行分析。蛋白質(zhì)濃度采用高效液相色譜專有定量方法進行分析。
3.2 風(fēng)險評估
本研究中的風(fēng)險評估由分析方法開發(fā)和哺乳動物細胞生物工藝開發(fā)方面的多學(xué)科專家團隊進行。專家們根據(jù)嚴重性(S)、發(fā)生率(O)和可檢測性(D)對風(fēng)險進行了評估,并將獲得最佳條件(高蛋白濃度、產(chǎn)量和高存活細胞密度)這一目標(biāo)的風(fēng)險作為評估的問題陳述。在評估過程中,根據(jù)這些因素的乘積RPN對每種條件進行排序。然后,通過標(biāo)準(zhǔn)的故障模式和影響分析法(FMEA)完成風(fēng)險評估工作。潛在因素分為兩類,一類取決于批次條件,另一類則不取決于批次條件。取決于批次變化的風(fēng)險因素被稱為不可控因素,可能帶來隨機或系統(tǒng)誤差(如與離線測量相關(guān)的誤差)。風(fēng)險評分與批次演變無關(guān)的因素,即初始批次條件,可在培養(yǎng)前通過選擇適當(dāng)?shù)氖芸嘏螚l件來降低。對于RPN值低于200且與批次變化無關(guān)的風(fēng)險,則不予考慮。
3.3 數(shù)據(jù)分析
在三十五個批次中獲取的所有光譜均被導(dǎo)入Matlab8.5 2015(MathWorks,Natick,MA,USA)。每個批次由經(jīng)過光譜預(yù)處理的12個點的平均值組成:第1次導(dǎo)數(shù)(25點窗口),然后是標(biāo)準(zhǔn)正態(tài)變異(SNV)。在批次級分析中,所有收集到的光譜都按時間順序排列,以創(chuàng)建批次進化模型(BEM)。通過主成分分析法(PCA),利用該模型的得分建立批次水平模型(BLM)。在BLM的得分圖中,每個點代表三十五個批次中的一個,它們在圖中的位置由光譜變異性決定。在本地模型分析中,光譜數(shù)據(jù)分類的較小單位是批次。具有相同特征的批次組(例如,所有2L批次)以等級表示。與某類批次特征(如刻度)相關(guān)的級別組被稱為批次條件。批次條件之間的關(guān)系相同的,則視為處于連續(xù)的階段(例如,每個細胞系(階段1)可衍生為不同的克隆(階段2))。數(shù)據(jù)使用偏最小回歸法(PLS)建立模型,其中拉曼位移為自變量(X變量),離線代謝物和蛋白質(zhì)濃度測定為因變量(Y變量)。模型的整體性能以均方根e。
在線拉曼光譜分析儀模型的建立過程包括利用35個批次的所有可用光譜數(shù)據(jù)創(chuàng)建PLS模型(通用模型),同時利用特定級別(一個或多個不同批次)的不同光譜數(shù)據(jù)集創(chuàng)建較小的PLS模型(局部模型)。創(chuàng)建局部模型采用了兩種策略。第一種策略是在批次條件的指導(dǎo)下建立本地模型。對于每個模型,校準(zhǔn)集由在特定條件下收集的所有光譜構(gòu)成,但校準(zhǔn)集中不包括特定級別的光譜。這種"只留一級"的策略被稱為"排除級局部建模(ELL)"。因此,對于每個批次條件,我們將根據(jù)每個批次條件中的等級數(shù)量來建立相同數(shù)量的 ELL 模型。第二種策略是只使用與單個級別相對應(yīng)的光譜來建立局部模型。我們稱這種策略為單級局部(SLL)建模。對于每個批次條件,我們的SLL模型數(shù)量與每個批次條件中的等級數(shù)量相同。圖1以批次條件"克隆"為例說明了上述校準(zhǔn)策略。
04 結(jié)果
4.1 初步風(fēng)險評估
使用魚骨圖或石川圖圖2-A列出并整理所有風(fēng)險,進行初步風(fēng)險評估。風(fēng)險按照材料、環(huán)境、工藝、測量、儀器和人力進行分類。圖2-B顯示了本研究分析的批次條件之間的層次和依賴關(guān)系。具有相同養(yǎng)育關(guān)系的批次條件共享同一階段。對風(fēng)險進行FMEA分析,篩選出與批次演變相關(guān)的風(fēng)險。
通過確定最小 RPN 值為 200,我們可以將重點放在8個可能事先影響拉曼信號的潛在風(fēng)險的影響上(表1)。
圖3顯示了批次級PCA前兩個主成分的得分。相同的得分圖以倍數(shù)表示(A至H),并根據(jù)不同的批次條件使用不同的色標(biāo)。35個批次的得分圖呈現(xiàn)出四個主要群組(CL1至CL4)。當(dāng)按比例對評分圖著色時(圖3-A),CL1組對應(yīng)15升批次(深藍色);CL2組對應(yīng)2升批次(淺藍色)和單個7升批次(淺綠色);CL3組對應(yīng)2升批次(淺藍色);CL4組對應(yīng)10000升批次(紅色)。當(dāng)按培養(yǎng)基對得分圖著色時(圖3-B),群組CL1同時對應(yīng)培養(yǎng)基1(深藍色)和培養(yǎng)基3(紅色);培養(yǎng)基2(淺綠色)在該圖的其余群組上被識別。在其余批次條件下,同樣的聚類識別并不清晰。當(dāng)按培養(yǎng)模式對得分圖著色時(圖3-C),CL3和CL4組分別對應(yīng)于灌流和分批培養(yǎng),而CL1和CL2組則顯示出兩種培養(yǎng)模式的混合。按細胞系(圖3-D)、最終培養(yǎng)基成分(圖3-E)、主要進料(圖3-F)、克隆(圖3-G)和培養(yǎng)基批次(圖3-H)著色時也呈現(xiàn)出同樣的趨勢,其中CL1和CL2顯示出多個不同級別的批次。
4.2 本地模型分析
為了比較每個批次條件下各層次生成的所有局部模型,本研究采用了一種類似于控制圖的可視化方法,其中x軸對應(yīng)于每個批次條件。所有散點表示每個局部模型在各自批次條件下的RMSECv。中心虛線用作基線,表示使用每種分析物的所有可用數(shù)據(jù)計算的通用模型RMSECv值(通用 RMSECv)。虛線上下的黃線分別表示一般模型RMSECv的±25%。上下紅線的作用相同,表示一般模型RMSECv的±50%。在ELL模型中,RMSECv 值與一般RMSECv的變化量不同于SLL模型。如果ELL和SLL模型的RMSECv值低于一般模型的該參數(shù),則該分析將認為ELL和SLL模型是可接受的。換句話說,所有批次條件都要求其所有局部模型的RMSECv值低于每個一般模型的0%。
圖4是葡萄糖的ELL模型和SLL模型
圖5是乳酸濃度的ELL模型和SLL模型
圖6是蛋白質(zhì)濃度的ELL模型和SLL模型
表2總結(jié)了針對8個批條件建立的局部模型的結(jié)果,包括批級PCA、級別模型和隨著獲得更多的過程相關(guān)知識,可以通過重復(fù)風(fēng)險評估來重新評估現(xiàn)有的過程理解。使用批級PCA聚類分析、ELL和SLL建模、使用批次范圍和本地模型數(shù)量的每批條件輸出摘要。標(biāo)記為黃色的RMSECv百分比表示所有本地模型在+25%和-50%的區(qū)間內(nèi),綠色表示所有本地模型低于0%的批量條件。在至少一個本地型號高于±50%的批量條件下,用紅色標(biāo)記的RMSECv百分比。
因此,表3中的初始風(fēng)險評估可以使用批級PCA、ELL、SLL和用于局部模型的批次數(shù)的結(jié)果進行更新(表4)。初始風(fēng)險分析(A)和最終風(fēng)險分析(B),基于批級PCA、ELL和SLL的結(jié)果,考慮了每個批條件的影響。
05 討論
RMSECv是一個比預(yù)測均方根誤差(RMSEP)-外部預(yù)測更好的指標(biāo)。這是因為不同的局部模型與外部預(yù)測之間的比較需要對兩個局部模型進行相同級別的驗證批次處理。最佳RMSEP偏向于與驗證批次共享相同級別的局部模型。為每個局部模型使用定制的外部驗證批次不僅需要額外使用設(shè)備,而且還需要編譯所有RMSEP值,以便建立適當(dāng)?shù)谋容^。使用模型的不同配置,以結(jié)構(gòu)的方式,并編譯所有不同的RMSEP值是RMSECv的最終目標(biāo),這使其成為本研究中最合適的方式。
PAT方法的使用在工藝開發(fā)期間尤為重要。使用來自多個生物反應(yīng)器規(guī)模(即水平規(guī)模)的數(shù)據(jù)需要使用特定于每個生物反應(yīng)器規(guī)模的本地模型,無論是使用SLL還是ELL模型,按比例進行模型分類產(chǎn)生了可行的結(jié)果(見表3),其中RMSECV不高于一般模型的10%。將這個方法用于葡萄糖和乳酸,并將這一結(jié)論擴展到蛋白質(zhì)濃度。一方面,單比例模型可以簡化規(guī)模放大,使用低成本的小批量作為校準(zhǔn)來驗證大批量。
對于培養(yǎng)模式來說,分批培養(yǎng)和灌流培養(yǎng)ELL和SLL建模都有互補的校準(zhǔn)集。這種批次條件產(chǎn)生的局部模型在ELL和SLL建模中范圍廣,其中一些模型RMSECv高于通用模型的RMSECv。批次條件下的細胞系在使用SLL或ELL時,在相同范圍內(nèi)的局部模型都有較好的結(jié)果。
綜上所述,該研究證明與通用模型相比,使用以批量條件為導(dǎo)向的模型構(gòu)建策略,所有局部模型的預(yù)測誤差都會減小。使用少量批次(3-9個)就能生成預(yù)測誤差較低的局部模型,這可以作為生產(chǎn)階段的校準(zhǔn)策略。批次條件也顯示使用類似的批次數(shù)量范圍(1-9),可產(chǎn)生較低的RMSECv值,是克隆的較好替代方案。
研究表明,評估影響拉曼光譜校準(zhǔn)模型的因素是提高該監(jiān)測預(yù)測性能的關(guān)鍵。在工藝開發(fā)過程中,拉曼監(jiān)測模型提供準(zhǔn)確和精確的預(yù)測,在許多工藝參數(shù)組合發(fā)生變化時同樣可以精準(zhǔn)預(yù)測。比較通用模型的RMSECv和特定本地模型的RMSECv,用于每個批次條件下的單個過程特征。通過構(gòu)建這些局部模型的方法,比較了通用模型(ELL建模)中每個層次對模型的影響和僅使用單個層次(SLL建模)對模型的影響。對于有效的局部建模策略,當(dāng)使用多種工藝數(shù)據(jù)進行校準(zhǔn)時,基于培養(yǎng)基或細胞生成的局部模型可以提供最佳結(jié)果,這種情況通常在工藝開發(fā)周期中發(fā)現(xiàn)。
此外,證明了基于不同克隆的本地模型在使用簡化的過程數(shù)據(jù)集時具有很高的準(zhǔn)確性。同時可以建立通用指南——例如,以標(biāo)準(zhǔn)操作程序 (SOP) 的形式,用于拉曼光譜 PAT 監(jiān)測。一旦落實到位,這些指南還可以用于開發(fā)方案,以適應(yīng)新的分子、工藝、產(chǎn)品模式,并為特定公司現(xiàn)有在使用 PAT(特別是拉曼光譜)的產(chǎn)品和平臺技術(shù)創(chuàng)建更通用的方法。
參考文獻:
[1]Santos, Rafael M.Kaiser, PhilippMenezes, Jose C.Peinado, Antonio.Improving reliability of Raman spectroscopy for mAb production by upstream processes during bioprocess development stages[J].Talanta: The International Journal of Pure and Applied Analytical Chemistry, 2019, 199.