Adaptive Parameter Optimization for Reinforcement Learning-Based Spark Job Scheduling

Guardat en:

Dades bibliogràfiques
Publicat a:	PQDT - Global (2025)
Autor principal:	Şen, Burak
Publicat:	ProQuest Dissertations & Theses
Matèries:	Load Scheduling Big Data Machine learning Computer science Optimization techniques Decision making Neural networks Seeds Data processing Batch processing Fault tolerance Cloud computing Workloads Markov analysis Business metrics Computer engineering
Accés en línia:	Citation/Abstract Full Text - PDF Full text outside of ProQuest
Etiquetes:	Afegir etiqueta Sense etiquetes, Sigues el primer a etiquetar aquest registre!

MARC


LEADER	00000nab a2200000uu 4500
001	3262110398
003	UK-CbPIL
020			\|a 9798297632325
035			\|a 3262110398
045	2		\|b d20250101 \|b d20251231
084			\|a 189128 \|2 nlm
100	1		\|a Şen, Burak
245	1		\|a Adaptive Parameter Optimization for Reinforcement Learning-Based Spark Job Scheduling
260			\|b ProQuest Dissertations & Theses \|c 2025
513			\|a Dissertation/Thesis
520	3		\|a This study presents an investigation on adaptive parameter optimization techniques for Reinforcement Learning-based Apache Spark job scheduling. Traditional Reinforcement Learning-based scheduling approaches suffer from the limitations of fixed hyperparameter configurations, requiring extensive manual tuning and often failing to adapt optimally to diverse workload characteristics. The research develops and evaluates adaptive mechanisms that enhance Proximal Policy Optimization (PPO) effectiveness through dynamic parameter adjustment. Four adaptive approaches are proposed: adaptive clipping that dynamically adjusts policy update constraints based on Kullback-Leibler divergence feedback, adaptive learning rate mechanisms that modulate optimization step sizes according to training progress, a combined approach leveraging both techniques simultaneously, and enhanced Generalized Advantage Estimation for improved value function approximation.The experimental evaluation is conducted within a comprehensive discrete-event simulator that accurately models Apache Spark execution semantics. The proposed mechanisms are tested using Transaction Processing Performance Council - High Performance (TPC-H) workloads across multiple random seeds to ensure statistical rigor and reproducibility. The adaptive mechanisms are formulated under the assumptions of policy gradient optimization theory and incorporate feedback-based parameter adjustment strategies. Sample problems are considered, and the solutions obtained for adaptive mechanisms are compared with those achieved by baseline implementation. The results reveal that, with proper adaptive parameter adjustment, the proposed mechanisms may become advantageous over traditional fixed-parameter approaches in terms of convergence stability, exploration effectiveness, and optimization quality. Bu çalışma, pekiştirmeli öğrenme tabanlı Apache Spark iş zamanlaması için uyarlanabilir parametre optimizasyon teknikleri üzerine bir araştırma sunmaktadır. Geleneksel pekiştirmeli öğrenme tabanlı zamanlama yaklaşımları, sabit hiperparametre konfigürasyonlarının sınırlılıklarından muzdarip olup, kapsamlı manuel ayarlama gerektirmekte ve çeşitli iş yükü özelliklerine optimal şekilde uyum sağlayamamaktadır. Araştırma, dinamik parametre ayarlaması yoluyla Proximal Policy Optimization (PPO) etkinliğini artıran uyarlanabilir mekanizmaları geliştirmekte ve değerlendirmektedir. Dört yenilikçi uyarlanabilir yaklaşım önerilmektedir: KL uzaklığı geri bildirimini temel alan dinamik politika güncelleme kısıtlarını ayarlayan uyarlanabilir kırpma, eğitim ilerlemesine göre optimizasyon adım boyutlarını modüle eden uyarlanabilir öğrenme oranı mekanizmaları, her iki tekniği eş zamanlı olarak kullanan birleşik yaklaşım, ve geliştirilmiş değer fonksiyonu yaklaşımı için Genelleştirilmiş Avantaj Tahmini. Deneysel değerlendirme, Apache Spark yürütme semantiğini doğru şekilde modelleyen kapsamlı bir olay-tabanlı simülatör içinde gerçekleştirilmektedir. Önerilen mekanizmalar, istatistiksel sağlamlık ve tekrarlanabilirlik sağlamak için çoklu rastgele tohum kullanılarak TPC-H iş yükleri ile test edilmektedir. Uyarlanabilir mekanizmalar, politika gradyan optimizasyon teorisi varsayımları altında formüle edilmekte ve geri bildirim tabanlı parametre ayarlama stratejilerini içermektedir. Örnek problemler ele alınmakta ve uyarlanabilir mekanizmalar için elde edilen çözümler temel uygulama ile karşılaştırılmaktadır. Sonuçlar, uygun uyarlanabilir parametre ayarlaması ile önerilen mekanizmaların yakınsama kararlılığı, keşif etkinliği ve optimizasyon kalitesi açısından geleneksel sabit parametre yaklaşımlarına göre avantajlı hale gelebileceğini ortaya koymaktadır.
653			\|a Load
653			\|a Scheduling
653			\|a Big Data
653			\|a Machine learning
653			\|a Computer science
653			\|a Optimization techniques
653			\|a Decision making
653			\|a Neural networks
653			\|a Seeds
653			\|a Data processing
653			\|a Batch processing
653			\|a Fault tolerance
653			\|a Cloud computing
653			\|a Workloads
653			\|a Markov analysis
653			\|a Business metrics
653			\|a Computer engineering
773	0		\|t PQDT - Global \|g (2025)
786	0		\|d ProQuest \|t ProQuest Dissertations & Theses Global
856	4	1	\|3 Citation/Abstract \|u https://www.proquest.com/docview/3262110398/abstract/embedded/L8HZQI7Z43R0LA5T?source=fedsrch
856	4	0	\|3 Full Text - PDF \|u https://www.proquest.com/docview/3262110398/fulltextPDF/embedded/L8HZQI7Z43R0LA5T?source=fedsrch
856	4	0	\|3 Full text outside of ProQuest \|u https://open.metu.edu.tr/handle/11511/116039