軟體工程師必須知道的10個概念

優秀的軟體工程師要通曉10個概念,這10個概念超越了程式語言與設計模式,軟體工程師應當從更廣的範圍內明白這些道理。下面一起和小編來看看吧!

軟體工程師必須知道的10個概念

  10. 關係資料庫 (Relational Databases)

關係資料庫因為在大規模 Web 服務上缺乏可擴充性而頗受微詞,然而,關係資料庫仍然是近20年來計算機技術中最偉大的成就。關係資料庫對處理訂單,公司資料方面有著出色的表現。

關係資料庫的核心是以記錄表示資料,記錄存放在資料庫表,資料庫使用查詢語言(SQL)對資料進行搜尋與查詢,同時,資料庫對各個資料表進行關聯。

資料庫的標準化技術(normalization)講的是使用正確的方式對資料進行分存以降低冗餘,並加快存取速度。

  9. 安全 (Security)

隨著黑客的崛起與資料敏感性的上升,安全變得非常重要。安全是個廣義的概念,涉及驗證,授權與資訊傳輸。

驗證是對使用者的身份進行檢查,如要求使用者輸入密碼。驗證通常需要結合 SSL (secure socket layer)進行;授權在公司業務系統中非常重要,尤其是一些工作流系統。最近開發的 OAuth 協議可以幫助 Web 服務將相應資訊向相應使用者開放。Flickr 便使用這種方式管理私人照片和資料的訪問許可權。

另外一個安全領域是網路設防,這關係到作業系統,配置與監控。不僅網路危險重重,任何軟體都是。Firefox 被稱為最安全的瀏覽器,仍然需要頻頻釋出安全補丁。要為你的系統編寫安全程式碼就需要明白各種潛在的問題。

  8. 雲端計算 (Cloud Computing)

RWW 最近的關於雲端計算的文章 Reaching For The Sky Through Compute Clouds 講到了雲端計算如何改變大規模 Web 應用的釋出。大規模的並行,低成本,與快速投入市場。

並行演算法發明以來,首先迎來的是網格計算,網格計算是藉助空閒的桌面計算機資源進行平行計算。最著名的例子是 Berkley 大學的 SETI@home 計劃,該計劃使用空閒的 CPU 資源分析太空資料。金融機構也大規模實施網格計算進行風險分析。空閒的資源,加上 J2EE 平臺的崛起,迎來了雲端計算的概念:應用服務虛擬化。就是應用按需執行,並可以隨著時間和使用者規模而實時改變。

雲端計算最生動的例子是 Amazon 的 Web 服務,一組可以通過 API 進行呼叫的應用,如雲服務(EC2),一個用來儲存大型媒體檔案的資料庫(S3),索引服務(SimpleDB),序列服務(SQS)。

  7. 併發 (Concurrency)

併發是軟體工程師最容易犯錯的地方,這可以理解,因為我們一直遵從線形思維,然而併發在現代系統中非常重要。

併發是程式中的並行處理,多數現代程式語言包含內建的併發能力,在 Java,指的是執行緒。關於併發,最經典的例子是“生產/消費”模式,生產方生產資料和任務,並放入工作執行緒消費或執行。併發的複雜性在於,執行緒需要經常訪問共同資料,每個執行緒都有自己的執行順序,但需要訪問共同資料。Doug Lea 曾寫過一個最複雜的併發類,現在是 core Java 的一部分。

  6. 快取(Caching)

快取對現代 Web 程式不可或缺,快取是從資料庫取回,並存放在記憶體中的資料。因為資料庫直接存取的代價非常高,將資料從資料庫取回並放在快取中訪問就變得十分必要。比如,你有一個網站,要顯示上週的暢銷書,你可以從資料將暢銷書榜一次性取回放在快取中,而不必在每次訪問時都去資料庫讀資料。

快取需要代價,只有最常用的內容才可以放入快取。很多現代程式,包括臉譜網,依靠一種叫做 Memcached 的分散式快取系統,該系統是 Brad Firzpatrick 在工作於 LiveJournal 專案時開發的,Memcached 使用網路中空閒的記憶體資源建立快取機制,Memcached 類庫在很多流行程式語言,包括 Java 和 PHP 中都有。

  5. 雜湊法(Hashing)

Hashing 的目的是加速訪問速度。如果資料是序列儲存的,從中查詢一個項的時間取決於資料列的大小。而雜湊法對每一個項計算一個數字作為索引,在一個好的 Hashing 演算法下,資料查詢的速度是一樣的。

除了儲存資料,雜湊法對分散式系統也很重要。統一雜湊法(uniform hash )用來在雲資料庫環境下,在不同計算機之間分存資料。Google 的索引服務就是這種方法的體現,每一個 URL 都被雜湊分佈到特定計算機。

雜湊函式非常複雜,但現代類庫中都有現成的類,重要的是,如何對雜湊法進行細調以獲得最好的效能。

  4. 演算法的複雜性 (Algorithmic Complexity)

關於演算法的複雜性,軟體工程師需要理解這樣幾件事。第一,大O標記法(big O notation);第二,你永遠都不應該使用巢狀式迴圈(迴圈裡面套迴圈),你應該使用 Hash 表,陣列或單一迴圈;第三,如今優秀類庫比比皆是,我們不必過分糾纏於這些庫的效能的差別,我們以後還有機會進行細調;最後,不要忽視演算法的優雅及效能,編寫緊湊的,可讀的程式碼可以讓你的演算法更簡單,更乾淨。

  3. 分層 (Layering)

用分層來討論軟體架構是最容易的。John Lakos 曾出版過一本關於大型 C++ 系統的書。Lakos 認為軟體包含了層,書中介紹了層的概念,方法是,對每個軟體元件,數一下它所依賴的元件數目就可以知道它的複雜程度。

Lakos 認為,一個好的軟體擁有金字塔結構,就是說,軟體元件擁有層層積累的複雜度,但每個元件本身必須簡單,一個優秀的軟體包含很多小的,可重複使用的模組,每個模組有自己的'職責。一個好的系統中,元件之間的依賴性不可交叉,整個系統是各種各樣的元件堆積起來,形成一個金字塔。

Lakos 在軟體工程的很多方面都是先驅,最著名的是 Refactoring (程式碼重構)。程式碼重構指的是,在程式設計過程中需要不斷地對程式碼進行改造以保證其結構的健壯與靈活。

  2. 慣例與模板 (Conventions and Templates)

命名慣例和基礎模板在程式設計模式中常被忽視,然而它可能是最強大的方法。命名慣例使軟體自動化成為可能,如,Java Beans 框架在 getter 和 setter 方法中,使用簡單的命名慣例。 網站的 URL 命名也使用統一的格式,如 會將使用者帶到所有標籤為 software 的頁。

很多社會網路均使用簡單命名,如,你的名字是 johnsmith ,那你的頭像可能命名為 johnsmith.jpg,而你的 rss 聚合檔案的命名很可能是 。

命名慣例還用於單元測試,如,JUnit 單元測試工具會辨認所有以 test 開頭的類。

我們這裡說的模板(templates )指的並不是 C++ 或 Java 語言中的 constructs,我們說的是一些包含變數的模板檔案,使用者可以替換變數並輸出最終結果。

Cold Fusion 是最先使用模板的程式之一,後來,Java 使用 JSP 實現模板功能。Apache 近來為 Java 開發了非常好用的通用模板, Velocity。PHP 本身就是基於模板的,因為它支援 eval 函式。

  1. 介面(Interfaces)

軟體工程中最重要的概念是介面。任何軟體都是一個真實系統的模型。

如何使用簡單的使用者介面進行模型化至關重要。很多軟體系統走這樣的極端,缺乏抽象的冗長程式碼,或者過分設計而導致無謂的複雜。

在眾多軟體工程書籍中,Robert Martin 寫的《敏捷程式設計》值得一讀。

關於模型化,以下方法對你會有幫助。首先,去掉那些只有在將來才可能用得著的方法,程式碼越精練越好。第二,不要總認為以前的東西是對的,要善於改變。第三,要有耐心並享受過程。