Abstract :
[en] Liquid chromatography method development is an important process in the pharmaceutical field, as the resulting method might be used during each critical steps of a product life, from the assessment of raw materials to the release of the final drug product. Recognizing its importance, regulatory agencies highlights the need of analytical procedure lifecycle management to ensure the quality of analytical methods. This concept includes the quality requirements of the method in the Analytical Target Profile (ATP), the development of the method as part of the analytical quality by design, and the validation of the method to verify that it meets the ATP. Method development often employs design of experiment principles to efficiently acquire the necessary information to model the retention of analytes with a minimum number of experiments. This approach is necessary due to the multitude of parameters that can be optimized to achieve successful separation using liquid chromatography, which would otherwise be a lengthy and suboptimal process. To improve on these principles, in silico screening of methods could be used to narrow the investigated domain and reduce the number of experiments needed further.
This thesis contributes to a larger research project aimed at developing a strategy for in silico screening applied to reversed-phase liquid chromatography using Quantitative Structure-Retention Relationship (QSRR) models, particularly suited for in-silico screening. In this context, this thesis addresses their current advantages and limitations. Indeed, one limitation is their requirement for a dataset containing sufficient relevant and robust information to train the models. To address this, a comprehensive dataset was designed and acquired. The dataset is composed of a variety of compounds covering wide ranges of physicochemical properties. The retention times have been collected under ten different conditions spanning two parameters, pH and gradient time. The individual compound injections, quality control sample monitoring, and the use of three different chromatographic systems improve the robustness of the dataset.
While the strength of the QSRR models is in their prediction of unknown compounds in known conditions, they struggle with reliable predictions in unknown conditions. To counter this limitation, a strategy is proposed to have them followed by Response Surface Models (RSM) chosen for their flexibility. Taking advantage of the availability of molecular descriptors necessary for QSRR models, the RSM equations are adapted according to the pKa of the analytes. This approach is further refined by applying the Bayesian framework to the models which offers mean prediction quality comparable to the previous frequentist approach. The Bayesian method simplifies the strategy by providing easier access to prediction errors.
Access to the prediction error is an important aspect of the strategy because the predictions inform a multicriteria decision analysis guiding the user toward a restricted investigation domain relevant to their requirements. This is achieved by calculating three criteria: separation efficiency, sensitivity to analysis parameters, and analysis time, and then incorporating the prediction uncertainty within these criteria. The criteria are then combined to determine the condition's suitability, weighted according to user-provided importance. To mitigate subjectivity in weight selection, the weights are derived from a distribution built around the user’s inputs. The strategy is applied to a test sample and the results are used to produce a Desing Space (DS). The results of the DS being consistent with those of the developed approach, this demonstrates that the two approaches are compatible.
In summary, the research carried out during this thesis led to the development of an approach meeting various constraints demonstrating that the development of a reversed-phase liquid chromatography method compatible with the quality requirements of the pharmaceutical industry can be facilitated by the incorporation of an in silico screening step.
[fr] Le développement d’une méthode de chromatographie liquide est un processus important dans le domaine pharmaceutique.En effet, la méthode résultante pourrait être utilisée à chaque étape critique de la vie d’un produit, depuis l’évaluation des matières premières jusqu’à la libération du produit médicamenteux final. Reconnaissant son importance, les agences réglementaires ont reconnu le concept de gestion du cycle de vie des procédures analytiques pour garantir la qualité des méthodes analytiques. Ce concept comprend les exigences de qualité de la méthode dans le profil cible analytique (ATP), le développement de la méthode dans le cadre de la qualité analytique dès la conception et la validation de la méthode pour vérifier qu'elle répond à l'ATP. Le développement de méthodes utilise souvent les principes de la conception d'expériences pour acquérir efficacement les informations nécessaires pour modéliser la rétention des analytes avec un nombre minimum d'expériences. Cette approche est nécessaire en raison de la multitude de paramètres qui peuvent être optimisés pour obtenir une séparation réussie par chromatographie liquide. En l'absence d'une telle approche, le processus se révèlerait long et sous-optimal. Pour améliorer ces principes, le criblage in silico des méthodes pourrait être utilisé pour restreindre le domaine étudié et réduire davantage le nombre d’expériences nécessaires.
Cette thèse contribue à un projet de recherche plus vaste visant à développer une stratégie de criblage in silico appliqué à la chromatographie liquide en phase inverse utilisant les modèles de relation quantitative structure-rétention (QSRR) particulièrement adaptés au criblage in silico. Dans ce contexte, cette thèse vise à étendre leurs avantages et limites actuelles. En effet, une limite est l’exigence d’un ensemble de données contenant suffisamment d’informations pertinentes et robustes pour entraîner les modèles. Pour résoudre ce problème, un ensemble de données complet a été conçu et acquis. L'ensemble de données est composé d'une variété de composés couvrant un large éventail de propriétés physicochimiques. Les temps de rétention ont été collectés dans dix conditions différentes couvrant deux paramètres, le pH et le temps de gradient. Les injections de composés individuels, la surveillance des échantillons de contrôle qualité et l’utilisation de trois systèmes chromatographiques différents améliorent la robustesse de l’ensemble de données.
Même si la force des modèles QSRR réside dans leur prédiction de composés inconnus dans des conditions connues, leur seconde limite est la faiblesse à établir des prédictions fiables dans des conditions inconnues. Pour contrer cette limitation, une stratégie est proposée afin de les adjoindre successivement à des modèles de surface de réponse (RSM) réputés pour leur flexibilité. Profitant de la disponibilité des descripteurs moléculaires nécessaires aux modèles QSRR, les équations RSM sont adaptées en fonction du pKa des analytes. Cette approche est encore affinée en appliquant le cadre bayésien aux modèles qui offreune qualité de prédiction moyenne comparable à l'approche fréquentiste précédente. La méthode bayésienne simplifie la stratégie en permettant un accès plus facile aux erreurs de prédiction.
L'accès à l'erreur de prédiction est un aspect important de la stratégie car les prédictions informent une analyse décisionnelle multicritère guidant l'utilisateur vers un domaine d'investigation restreint correspondant à ses besoins. Ceci est réalisé en calculant trois critères : l'efficacité de séparation, la sensibilité aux paramètres d'analyse et le temps d'analyse, en intégrant l'incertitude de prédiction dans ces critères. Les critères sont ensuite combinés pour déterminer l'adéquation de la condition, pondérée en fonction de l'importance fournie par l'utilisateur. Pour atténuer la subjectivité dans la sélection des pondérations, les pondérations sont dérivées d’une distribution construite autour des entrées de l’utilisateur. La stratégie est appliquée à un échantillon test et les résultats sont utilisés pour produire un Design Space (DS). Les résultats de la DS étant cohérents avec ceux de l’approche développée, cela démontre que les deux approches sont compatibles.
En résumé, les recherches menées au cours de cette thèse ont conduit au développement d'une approche répondant à diverses contraintes démontrant que le développement d'une méthode de chromatographie liquide en phase inverse compatible avec les exigences de qualité de l'industrie pharmaceutique peut être facilitée par l'incorporation d'une étape de criblage silico.