1. 正态分布性质
a) 随机生成 1000 个标准正态分布的变量,画出柱形图,并且在柱形图的基础上用正态分布
的 pdf 进行拟合。
b) 在 a)生成的变量基础上,如何将这 1000 个变量转变成服从 N(3,4)的随机变量?画出柱形
图,并且在柱形图的基础上用正态分布的 pdf 进行拟合。
c) 随机生成 1000 组独立的标准二维正态分布随机变量
d) 。如何利用这个二维独立正态分布的变量生成相关系数=0.5 的二维正态分布随机变量(边
缘都是标准正态)?提示:利用正态分布的线性性质。(事实上,编程软件直接生成非独 立的二维正态分布也是用的类似方法。)
2. 二项分布的近似
a) 随机生成 1000 个(0,1)均匀分布的变量定义为向量 X。定义一个和 X 一样维度的向量
Y,如果 Y 的元素对应的 X 元素大于 0.95,则 Y 的该元素取 1,否则取 0。定义标量 z 为向
量 Y 的和。说明 z 服从 b(1000,0.05)的二项分布。
b) 重复上述过程 100 次,你将得到 100 个 z,把它们定义为一个向量 Z。画出 Z 的柱形图。
c) 随机生成 100 个 lambda=50 的泊松分布。画出它们的柱形图,并和 Z 的柱形图进行比较。
d) Z 也可以用正态分布的随机变量近似,计算正态分布的参数 mu, sigma^2。在 a)的基础上画
出正态分布的 pdf。
3. 验证中心极限定理:
Y 假设每个同学的概率论期末考试成绩是独立同分布的,且都服从 gamma(70,1)的分布。 gamma(70,1)的期望和方差都是 70。假设每年有 250 个学生选概率论这门课,根据中心极限定 理,这 250 个学生班级均分服从正态分布,计算它的期望 mu 和方差 sigma^2。下面我们来验证一 下。
a) 随机生成 250 个学生的考试成绩,将其定义为向量 X (用命令 rgamma(250,70))。重复这个 过程 500 次(意味着我教了 500 年� 的这门课),你将得到 500 个 X,把这个 500 个 X 定义 成一个矩阵 Y,Y 的维度应该是 250*500.
b) 计算 Y 的每一列的均值得到向量𝑌𝑌(提示:对矩阵每列求均值可以�使用 colMeans 函数)。 这个向量的每个元素对应当年的概率论班级的期末平均分。画出𝑌𝑌的柱形图,并画出 N(mu, sigma^2)的 pdf,看看它们是否吻合?
4. 投资组合分散风险
a) 载入股票价格的数据。
tires <- scan(n=157) 307 315 316 314 324 310 311 295 278 295 318 343 342 323 328 303 309 307 315 296 313 316 317 306 307 326 330 330 333 341 337 353 356 359 349 351 359 360 363 342 337 334 352 357 360 368 363 366 366 365 381 401 401 421 422 425 417 427 436 440 432 406 401 420 420 424 416 403 400 392 391 390 406 415 429 420 415 420 417 445 447 449 447 450 460 470 495 507 518 516 522 524 484 497 490 500 464 458 446 450 471 485 486 501 506 502 494 497 465 478 490 496 517 506 497 483 474 495 499 483 477 481 474 479 431 438 431
436 434 453 442 445 461 463 481 490 470 480 497 507 503 508 485 492 490 519 506 539 542 553 558 562 532 510 512 504 474
liquor <- scan(n=157) 781 784 757 741 728 726 743 746 768 752 758 754 779 777 780 815 791 779 802 797 800 860 873 854 855 846 824 833 838 851 827 847 859 853 926 935 952 962 958 943 938 949 1000 1003 1018 1022 1026 1019 1037 1026 999 1011 994 1036 1030 1028 1005 1006 1005 970 983 984 980 996 975 976 987 1008 1057 1054 1040 1045 1057 1101 1096 1094 1108 1102 1104 1105 1092 1098 1113 1076 1060 1054 1054 1057 1078 1077 1091 1093 1079 1086 1064 1134 1167 1217 1155 1171 1174 1213 1218 1250 1329 1350 1334 1318 1315 1310 1368 1370 1389 1420 1377 1366 1424 1455 1475 1478 1458 1430 1409 1407 1414 1409 1402 1386 1392 1391 1445 1448 1462 1474 1482 1495 1525 1547 1538 1436 1465 1454 1460 1476 1521 1588 1581 1587 1539 1574 1537 1518 1530 1500 1554 1532 1498
b) 计算这两支股票的 log return。log return = ln P(t+1)- ln P(t)。提示:可使用 diff 函数。
c) 画出这两支股票 log return 的散点图。观察散点图,你觉得这两支股票的相关性如何?
d) 计算这两支股票 log return 的均值,标准差,和相关系数。
e) 画出这两支股票的柱形图,并用正态分布的 pdf 进行拟合。
f) 根据 d)中的统计量,说说你觉得哪支股票更有吸引力?
g) 一个 50%轮胎股 50%酒水股的投资组合的 log return 是
portfolio.lr <- 0.5*tires.lr + 0.5*Liquor.lr
计算这个投资组合的均值和标准差。由此说说为什么投资者应该分散投资的风险?
5. 期权定价: 我们在这个小练习当中在一个简化的模型里定价一个 at-the-money(ATM)的看涨 (看跌)期权。大家以后会学到期权的定价是在风险中性测度中进行的。基于此,我们简单 地假设一个月之后的股票 log return,X,服从 N(a,b)的分布。这里的 a 是一个月的无风险利 率。假设年化的无风险利率 r = 3%, 月度的无风险利率 a = r/12 = 0.25%. 假设期权的行权价格 K=E[S_T] = S_0exp(a) = 100.25.
a) 假设股票的年化波动率 sigma=20%。年化波动率即 12 个独立同分布的 X 的和的标准差 (思考这里的假设是什么)。由此计算 b 是多少?
b) 假设 t=0 的股票价格为 S_0 = 100。随机生成 1000 个一个月后的股票价格 S_T。提示:先生 成 1000 个 log return,每个 log return 都对应一个价格。
c) 在这 1000 种情景下计算每个情景的看涨期权 C_T = max(0, S_T-K)的价值。计算这 1000 个 C_T 的平均值 c。c 即这个看涨期权在 t=0 时期的价格。提示:用 pmax 函数。
d) 在这 1000 种情景下计算每个情景的看跌期权 P_T = max(0, K-S_T)的价值。计算这 1000 个 P_T 的平均值 p。p 即这个看涨期权在 t=0 时期的价格。提示:用 pmax 函数。
e) 著名的 Black-Sholes 期权定价公式为
c = Φ(d1)S0 − Φ(d2)PV(K) 0 p = Φ(−d2)PV(K) − Φ(−d1)S
其中,Φ 是标准正态的 0cdf。PV(K)是行权价格 K 在 t=0 时刻的现值,即 PV(K) = 𝐾𝐾𝐾𝐾𝐾𝐾𝐾𝐾(−𝑎𝑎) = 𝑆𝑆 .
另外,
d1= 1 �ln�𝑆𝑆0�+�𝑟𝑟+𝜎𝜎2�∗𝜏𝜏� σ√𝜏𝜏 𝐾𝐾 2
d2 = d1−σ√𝜏𝜏
其中τ是期权的期限,即 1/12(以年为单位),σ和r分别是年化的波动率和无风险利率。
用 BS 公式计算该看涨和看跌期权的价格,看一看和 c),d)中算的价格相差大不大。