2022 年即將結束,許多工程領導者利用這段時間回顧過去的一年,並開始為即將到來的一年做好規劃。資料工程團隊通常被任務和需求淹沒,很多時候還伴隨著需要立即關注的故障和問題。因此,使用新年計劃來重新建立應在團隊內部強化的最佳實踐和方法,始終是建議的方法。
過去的一年對科技業來說非
常具有挑戰性。即使是沒有直接受到經濟放緩影響的公司也開始重新評估支出和員工人數,以開始適應經濟衰退時期。這意味著,削減任何可以避免的成本,並努力以更少的資源保持業務成長和創造收入。
2023 年會是什麼樣子?
自大流行以來,科技業經歷瞭如此戲劇性的三年,試圖預測未來會發生什麼聽起來像是一次失敗的嘗試。然而,有一些原則和行為始終與成功經營企業相關,並且在經濟不確定的時期它們變得更加重要。削減營運成本始終是必要的,現在甚至更是如此。
在削減成本和減少員工時,組織需要開
始更好地利用現有資源。受到裁員和裁員影響的團隊可能會在新能力方面遇到困難,並且需要被賦予專注於交付導向的思維方式。像往常一樣,但現在比以往任何時候都更重要的是,工程交付應該快速並對客戶產生積極影響。
根據這些原則,我們創建了一份簡短的新年決心清單,建議每個處理大數據的工程團隊考慮。
需要考慮的 4 項新年決心
1. 降低儲存成本
在為經濟狀況不確定的一年做計劃時,首先想到的就是降低成本。從這個意義上說,雖然組織越來越依賴他們的數據,但雲端預算中的這條線似乎注定會不可避免地成長。然而,雖然資料肯定會成長,但好消息是有有效的 越南 WhatsApp 號碼數據 方法來控制儲存資料的成本。
此類方法包括: 使用分層儲存;考慮從表格資料架構轉向物件儲存;確保資料架構最適合組織正在使用的資料類型;使用分支來獨立開發和測試數據等。
2. 提高數據工程團隊的效率
在充滿挑戰的經濟時期,當被迫凍結新招聘,在某些情況下甚至縮小資料工程團隊的規模時,我們會盡一切努力來提高現有團隊的生產力和影響力,這是有意義的。我們可以非常有效地實現這一目標,為我們的數據團隊配備適當的工具和最佳實踐。
這些將幫助他們停止重複耗時的任務
這些任務是強制性的,但卻浪費了他們大量的時間。其中一個最佳實踐是使他們能夠開發和測試新資料來源和 ETL,而無需複製任 這樣您就可以減少交貨時間 何內容。透過這種方式,他們不需要複製和管理資料的多個克隆,從而節省了寶貴的時間,但更重要的是:他們能夠在最新的生產資料上徹底測試他們的工作,並確保他們建立的內容具有最高的質量,並且不會造成回歸、不一致和其他數據故障。
3. 透過幫助數據工程團隊專注於創造價值的任務來增強他們的能力
資料工程師在任何大數據驅動的組織中都處於核心地位。這是因為他們的工作是滿足組織內部和外部大量客戶的需求。隨著數據在許多組織中變得越來越重要,這變得更具挑戰性。這是因為,每當發生錯誤或不一致時,就有可能成為影響業務本身的問題。
在大數據環境中(尤其是在物件儲存中)重現資料故障可能是最令人沮喪、最耗時的任務之一在大數據環境中(尤其是在物件儲存中)重現 印度數據 資料故障可能是資料工程師需要執行的。之所以會發生這種情況,是因為在處理資料湖時,沒有內建方法可以恢復到發生故障時資料的確切狀態。有一些解決方案可以幫助工程師及時返回特定表或一組表,但在許多情況下,由於資料湖內廣泛進行的更改而發生故障和不一致。
確保工程師配備正確的工具來盡其所能地完
成工作是一項管理責任,但好消息是有許多開源工具可以幫助實現這一目標。LakeFS就是這樣的工具之一,它透過資料版本控制實現測試和生產的可重複性它透過添加到資料湖的
整合此類工具的投資很快就會得到回報,因為它們可以幫助資料工程師專注於深度分析本身,而不是將時間浪費在可以透過自動工具輕鬆完成的重複任務上。
4. 快速交付有價值的產品-不影響數據質量
在經濟不確定時期,組織比平常更需要專注於為顧客帶來的價值。在軟體工程中,這意味著在短週期內交付有價值的優質產品,以留住現有客戶並提高他們的滿意度。這需要在短時間內輕鬆應用建置、測試和運輸產品的流程,但不影響其品質。
在軟體開發中,採用 CI/CD 數據概念可以幫助組織從漫長、緩慢的瀑布方法轉變為創新敏捷和競爭優化的組織,不斷向客戶提供高品質的產品。