【SAS】淺談SAS:綜論篇

《科學計算專題:SAS》

淺談SAS:綜論篇

作者:戴小琦

SAS統計軟體簡介:

SAS的英文全名是Statistical Analysis System(統計分析系統)
。這個軟體是從 1960 年代末期由美國北卡羅萊納州立大學(North
Carolina State University) 統計系的 A.J.Barr 與J.H.
Goodnight 兩位教授開始發展;SAS系統設計的目的是將資料處理後
,產生相關的或有用的資訊,並提供使用者製作報表、分析、決策
之用,故整個SAS 系統是以資料為中心,來進行資料擷取、資料管
理、資料分析及資料展示(present)等整合工作,以下即為您一一介
紹這四項內容。

(一)資料擷取

目前SAS可以取用之資料除了一般ASCII檔之外,還可使用資料庫
以及SPSS的資料檔。SAS 目前可抓取的資料庫之資料有:
ADABAS,AS/400,DB2,DB/2,DB2/6000,Infor-mix,INGRES,ODBC,ORACLE,
SYBASE and SQL Server等,除此之外,SAS還可將SPSS的資料檔
轉成SAS資料集。資料擷取除了上述方式之外,還可透過 SAS/FSP
將原始數據直接從螢幕鍵入,亦可透過 SAS/ACCESS 與其它資料庫
溝通,或者透過 SAS/CONNECT與其它電腦(主機、PC)連線來取用資
料。

(二)資料管理

資料管理顧名思義是將有用的資料,相關的欄位留下使用,去蕪
存菁,而使用者可透過 SAS/BASE 產品及 SQL(結構化查詢語言)程
序,對研究樣本資料作摘要表、中文內碼轉換、加密碼,或透過
SAS/FSP 做產品設計、問卷的登錄及錯誤碼的檢查等做資料管理。

SAS 資料管理,具有下列幾項功能:如,不同格式(日期、字串、
數值)資料之間的管理;不同 PC或主機之間的資料管理;資料排序
;檔案水平或垂直合併;篩選資料檔符合某些條件式之觀察值;篩
選某些變數;更新資料檔內容;變數變換;文字變數和數值變數之
間的轉換及日期(date)、時間資料的處理等。

(三)資料分析

資料分析則是把資料進一步分解成各種有用的部分,轉化為有用
的資訊。以SAS進行的統計分析,約有下列幾種:描述性統計;迴歸
分析;變異數分析;無母數統計;多變量分析;區別分析;集群分
析;計分(scoring)分析;生存(survival)分析;預測分析;計量分
析;作業研究;品質管理;決策分析;電腦效能評估方析及生物及
醫學診療研究分析等。

而使用者依各別領域的不同,所須的SAS軟體工具亦有所差異,您
可以利用下列 SAS 產品做資料分析(見表一)。

        表一
┌─────┬────────────┐
│SAS軟體 │ 統計功能 │
├─────┼────────────┤
│SAS/BASE │ 進行初等統計分析 │
├─────┼────────────┤
│SAS/STAT │ 進行高等統計分析 │
│ │ 及多變量統計分析 │
├─────┼────────────┤
│SAS/ETS │ 進行計量經濟及時 │
│ │ 間數列分析 │
├─────┼────────────┤
│SAS/OR │ 進行專案管理之作 │
│      │ 業研究 │
├─────┼────────────┤
│SAS/CACL │ 速算表運算 │
├─────┼────────────┤
│SAS/LAB │ 具有人工智慧式人 │
 │      │ 機交談環境,以進 │
 │      │ 行線性(或非線性) │
 │      │ 迴歸、變異數分析, │
 │      │ 及共變數分析,它可 │
 │      │ 根據分析結果進行解 │
 │      │ 釋及繪統計圖。 │
├─────┼────────────┤
│SAS/QC │ 進行品質管制。 │
├─────┼────────────┤
│SAS/IML │ 進行矩陣運算。 │
├─────┼────────────┤
│SAS/ASSIST│ 可自動產生 SAS 程式。 │
├─────┼────────────┤
│SAS/EIS │ 用來開發主管資訊系統。 │
├─────┼────────────┤
│SAS/AF │ 讓使用者可自己設計物件 │
 │      │ 導向應用系統。 │
├─────┼────────────┤
│SAS/PH- │ 做生物及醫學診斷實驗。 │
│Clinical │ │
└─────┴────────────┘

(四)資料展示

資料展示則是利用文件、表格或圖形等方式,將相關的資訊呈現
出來。它可透過SAS/Graph產生高解析度統計圖, SAS/GIS產生地理
資訊系統,SAS/Insight 產生資料和統計圖之間動態連結。

硬體需求及其特色

SAS為非電腦專業人員特別設計了一套不必撰寫SAS程式的軟體-
SAS for Windows,它可依其不同統計模式及選項,來做不同的分析
。其硬體需求及特色如下:

(一) 個人電腦硬體之基本需求:

1.386以上個人電腦均可安裝。
2.主記憶體(RAM)至少要 8 MB。
3.硬碟剩餘空間至少 100 MB 以上。
4.MS Win3.1 或以上之版本(最好為中文)。

(二) 特色:

1.具有32 bit 系統處理及資料表示法。

2.圖形使用介面(GUI)的改善。

3.加強SAS/AF 物件導向程式設計員對 Application Work
Space(AWS)的畫面控制:透過動態連結資料庫(DLL)技術,來整合
SAS/AF應用系統和 Windows 其它應用程式。

4.列印報表功能的加強:可根據印表機種類,自動調整報表長度
及寬度。

5.加強統計圖形輸出入的彈性:可將 PC 圖形檔格式輸入到
SAS/GRAPH中;同時亦可將 SAS 圖形檔(.grseg)存成不同格式 PC
圖形檔如:(*.bmp、 *.ttf)。

6.提供開放式資料連結(ODBC):以達到和其它套裝軟體之間的資
料共享。

7.支援 True Type 字形。

8.在「ASSIST」視窗中,系統可依據目前 user 所選擇狀態,自
動產生SAS 程式省去初學者語法上鍵入的錯誤性。

SAS資料檔:


在任何一個 SAS 的程式裡,均可建立一個以上的 SAS 資料檔,
其命名方式為二段式(two-level),如:mylib.test,前半段為 SAS
資料檔所在之目錄館名稱(Library reference),若該資料屬臨時資
料檔,則內定存於 work 臨時目錄;後半段為資料檔名稱。前後兩
段以"." 區隔,各不得超過8個字元。

所謂的 SAS 資料檔是自外部輸入之一般的文、數字資料,此種資
料使用者可以讀懂,又稱為文字資料(Text Data),再經 SAS 系統
轉換即成為SAS 資料集(SAS Data Set)。

它的組成有三個部份:

(1) 資料檔名稱
(2) 一組變數名稱
(3) 變數所有觀察值

SAS 資料檔的建立:

(一) 在程式內建立臨時資料檔

如:DATA test;

此法所建之臨時資料檔皆暫存在 SAS 開設之臨時工作區,即 SAS
安裝目錄下的子目錄 SASWORK。一旦退出 SAS 系統,臨時資料檔將
會消失。以本例而言,〝test〞檔即為臨時資料檔,且存放於
SASWORK目錄下。

(二) 在程式外建立永久資料檔

永久資料檔的好處在於方便日後再次取用,建立方式如下:

Libname libref d:directory';
/* 目錄館‵libref′位於
‵d:directory′*/

Data libref.dname;
/* 二段式的資料名稱即資料名
‵dname′位於
‵d:directory′下之目錄館
‵libref′*/

取用之法:
Libname libref 'd:directory';
Data new; /* 新臨時資料集‵NEW′*/

set libref.dname; /* 取用永久資料集
‵libref.dname′*/

結語:

SAS在歷經多次改版更新後,本院現行版本(主機版、Windows)
6.11版,除了增強原有統計功能外,還具備了資料庫管理、高階語
言撰寫、報告撰寫、精密繪圖、網路連結,資料共享等功能,同時
亦相繼推出資料倉儲、線上分析、主管資訊系統等產品。目前SAS更
朝向個人化、中文化、 MIDI 等方向發展,且讓我們拭目以待。

留言

這個網誌中的熱門文章

【統計】統計名詞中英文對照

【Apple】在mac上面可以正常讀寫NTFS:MacFUSE+NTFS-3G

【教學】一些簡單調酒方式