職位描述:
1、系統(tǒng)監(jiān)控與告警:
負責核心業(yè)務系統(tǒng)的日常監(jiān)控,確保監(jiān)控覆蓋全面、指標合理有效。
配置、維護和優(yōu)化告警規(guī)則,確保告警及時、準確、有效,減少誤報漏報。
及時響應并初步評估告警信息。
2、故障響應與處理:
快速定位問題根因并實施有效解決方案,最大限度減少故障影響范圍和時長。
負責或參與故障復盤,深入分析故障原因,制定并跟進改進措施(包括但不限于技術改進、流程優(yōu)化),形成知識庫沉淀。
3、性能分析與優(yōu)化:
定期進行系統(tǒng)性能分析,主動發(fā)現(xiàn)潛在瓶頸(如慢SQL、接口RT過高、資源消耗異常等)。
制定并執(zhí)行性能優(yōu)化方案,提升系統(tǒng)吞吐量、降低延遲、提高資源利用率。
進行容量評估和規(guī)劃。
4、穩(wěn)定性保障體系建設與實施:
參與設計和實施提升系統(tǒng)穩(wěn)定性、容錯性和可觀測性的解決方案(如完善限流熔斷策略、優(yōu)化重試機制、增強日志和鏈路追蹤、提升監(jiān)控能力等)。
參與制定和執(zhí)行變更管控流程,確保上線、配置變更等操作對穩(wěn)定性的影響可控。
參與應急預案的制定、演練和維護。
5、技術債務清理與日常維護:
負責對現(xiàn)有系統(tǒng)進行維護和迭代,修復已知缺陷和安全漏洞。
識別并逐步清理技術債務,提升代碼質量和系統(tǒng)可維護性。
負責處理日常的服務請求和用戶反饋中涉及系統(tǒng)穩(wěn)定性的問題。
6、加分項:3年及以上Java后端開發(fā)經驗
任職要求:
1、基礎經驗與技能:
精通Java語言核心特性和常用類庫,理解JVM基本原理(內存模型、垃圾回收機制、類加載機制、常用性能監(jiān)控工具如jstat, jmap, jstack等)。
熟練掌握主流Java開發(fā)框架(Spring Boot, Spring Cloud, Spring MVC, MyBatis/Hibernate等)及其核心原理。
熟悉主流數(shù)據(jù)庫(MySQL, PostgreSQL等)的使用、設計、優(yōu)化和常見問題排查(慢查詢、鎖、事務)。
熟悉常用中間件(Redis/Memcached, RabbitMQ/Kafka, Elasticsearch等)的原理、使用、配置優(yōu)化及常見問題處理。
熟練掌握Git等版本控制工具,熟悉Maven/Gradle等構建工具。
熟悉Linux操作系統(tǒng)常用命令,具備基本的運維能力(日志查看、進程管理、簡單腳本編寫)。
2、系統(tǒng)穩(wěn)定性核心能力:
強烈的系統(tǒng)穩(wěn)定性意識和責任心: 深刻理解系統(tǒng)穩(wěn)定性對業(yè)務的重要性,對線上問題有高度的警惕性和快速響應意愿。
扎實的問題排查與定位能力:
具備豐富的線上故障排查經驗,能快速定位和解決JVM問題(OOM、GC頻繁、線程死鎖)、數(shù)據(jù)庫問題、中間件問題、網(wǎng)絡問題、性能瓶頸等。
3、性能調優(yōu)經驗:
有實際的系統(tǒng)性能瓶頸分析、定位和調優(yōu)經驗,能對JVM、SQL、緩存、消息隊列、接口響應等進行有效優(yōu)化。
4、高可用設計理解:
理解常見的高可用架構設計模式(如集群、負載均衡、熔斷、降級、限流、重試)并能應用于實踐或問題解決。
5、軟技能:
良好的溝通協(xié)作能力,能夠清晰表達技術問題并專業(yè)開發(fā)、測試、運維、產品等團隊有效協(xié)作。
優(yōu)秀的學習能力和技術熱情,能快速學習新技術并應用于解決實際問題。
嚴謹?shù)倪壿嬎季S和分析能力,面對復雜問題能抽絲剝繭,找到關鍵點。
抗壓能力,能冷靜、高效地處理線上緊急故障。
文檔習慣,能清晰記錄問題分析過程、解決方案和系統(tǒng)運行狀態(tài)。
要求:大學本科及以上學歷;計算機類、計算機(軟件)類、計算機(網(wǎng)絡管理)類、電子信息類;