John Allspaw, Pengasas bersama, Makmal Kapasiti Penyesuaian

Bagaimana Sistem Anda Pastikan Hari Berlari Selepas Hari

Pertama, sedikit tentang John Allspaw, Pengasas Penyelaras Kapasiti Penyelarasan, dan bekas Ketua Pegawai Teknologi Etsy.

Sebagai peneraju kejuruteraan dan penyelidik dengan lebih dari 20 tahun pengalaman dalam membina dan mengetuai pasukan yang terlibat dalam perisian dan sistem kejuruteraan, Allspaw telah menghabiskan dekad lalu merapatkan pandangan dari Faktor Manusia, Kejuruteraan Sistem Kognitif, dan Kejuruteraan Ketahanan kepada domain kejuruteraan perisian dan operasi.

Juga pengarang dua buku, "Seni Perancangan Kapasiti: Sumber Web Penyaringan" dan "Operasi Web" (O'Reilly Media), Allspaw terus menyumbang kepada komuniti IT dan DevOps melalui bercakap dan kolaborasi dalam kajian baru yang menarik.

Kami cukup bernasib baik untuk menjadi tuan rumah John di Sidang Kemuncak Enterprise DevOps di San Francisco, di mana beliau mengambil bahagian untuk membincangkan tentang "Bagaimana Sistem Menjalankan Hari Selepas Hari Ini." Di bawah, kami telah menyalin urusan utama dan sorotan utama persembahannya .

John Allspaw di DOES17 San Francisco

John Allspaw

Bagaimana Sistem Anda Pastikan Hari Berlari Selepas Hari

Apa yang saya ingin bicarakan adalah baru. Ia berbeza, dan saya rasa sangat kuat tentang perkara ini.

Untuk membantu menetapkan pentas, tesis saya untuk ijazah dalam Faktor Manusia dan Keselamatan Sistem adalah "Perdagangan yang Berlaku di bawah Tekanan: Heuristik dan Pemerhatian Pasukan Mengatasi Gangguan Perkhidmatan Internet."

Sebahagian daripada anda mungkin pernah mendengar tentang ini, apa yang disebut Laporan Stella.

Pada tahap yang tinggi, laporan ini adalah hasil daripada satu projek konsortium rakan kongsi industri sepanjang tahun. IBM, Etsy, dan IEX, syarikat perdagangan, pertukaran perdagangan di Manhattan. Sepanjang tahun ini, orang-orang dari Makmal Kejuruteraan Sistem Ohio State University, David Woods, Richard Cook, dan beberapa orang lain melihat secara mendalam pada satu kejadian di setiap organisasi tersebut.

Mereka mendapati enam tema ini dan biasa di kalangan mereka.

Sudah tentu hasilnya agak penting. Begitulah penyelidikan itu dilakukan yang saya mahu anda semua lihat.

Berikut adalah pengambilalihan utama saya dari laporan:

  1. Kita perlu mengambil serius prestasi manusia dalam industri ini. Jika kita tidak, kita akan terus melihat sistem rapuh dengan kesan yang semakin meningkat terhadap perniagaan dan masyarakat kita.
  2. Kita boleh melakukan ini dengan melihat insiden melampaui apa yang sedang kita lakukan pada postmortem atau ulasan pasca insiden atau ulasan selepas tindakan.
  3. Ada wujud kaedah dan pendekatan dari kajian ketahanan dalam domain lain, tetapi mereka memerlukan komitmen yang nyata untuk diteruskan. Melakukannya adalah perlu dan sukar, tetapi ia akan menjadi kelebihan daya saing untuk perniagaan yang melakukannya dengan baik.

Pertama, saya ingin memulakan dengan sedikit asas, sedikit perbendaharaan kata yang akan menjadi penting kerana saya semacam berjalan anda melalui ini. Saya akan menerangkan jenis gambar, perwakilan, seperti model mental organisasi anda, dan ia akan mempunyai rantau di atas talian dan rantau di bawah garis.

Sekiranya anda membayangkan apa yang kita lihat di sini, ini adalah produk anda, perkhidmatan anda, API anda, atau apa sahaja perniagaan anda memperoleh nilai dan memberi kepada pelanggan. Baik? Di dalamnya, apa yang anda lihat ialah kod anda. Anda melihat timbunan teknologi anda. Anda melihat data dan beberapa cara menyampaikannya, bukan? Mungkin melalui internet atau cara lain. Tetapi jika kita tinggal di sini, tiada siapa yang akan mempercayai saya bahawa itulah yang kita panggil sistem, kerana ia baik-baik saja, tetapi ia tidak benar-benar lengkap.

Apa yang benar-benar berkaitan, dan apa yang banyak orang bercakap tentang di sini dalam komuniti Summit DevOps Enterprise adalah semua perkara yang kita lakukan untuk memanipulasi apa yang berlaku di sana, dan oleh itu kita mempunyai alat ujian. Kami ada alat pemantauan. Kami mempunyai alat penyebaran dan semua perkara yang semacam berwayar. Ini adalah perkara yang kita gunakan. Anda boleh mengatakan bahawa ini adalah sistem, kerana ramai daripada kita menghabiskan masa kita memberi tumpuan kepada perkara-perkara yang tidak berada di dalam gelembung kecil di sana, tetapi semua perkara yang ada di sekelilingnya, tetapi jika kita tetap bersama dengan ini, kita tidak dapat melihat di mana kerja sebenar berlaku.

Apa yang akan kita lakukan di sini adalah, kita akan melukis garis yang kita panggil garis perwakilan, dan kemudian menggali lebih mendalam. Apa yang kita lihat di sini ialah anda. Semua orang yang mendapat bahan siap untuk menambah sistem, untuk mengubah sistem. Anda sedang membuat rangka seni bina. Anda melakukan pemantauan. Anda menjejaki apa yang dilakukannya, bagaimana ia melakukannya, dan apa yang sedang berlaku dengan mereka.

Sekarang, anda akan perhatikan bahawa setiap orang ini mempunyai beberapa gambaran mental mengenai sistem apa itu. Jika anda melihatnya sedikit lebih dekat, anda akan melihat bahawa tiada seorang pun daripada mereka yang sama. By the way, itu sangat ciri-ciri peranan ini. Tiada siapa yang mempunyai perwakilan yang sama dengan apa yang di bawah garis.

Untuk meringkaskan, ini adalah model dunia kita, dan ia termasuk bukan hanya perkara yang berjalan di sana, tetapi anda semua, jenis aktiviti yang anda lakukan, kerja kognitif yang anda lakukan untuk memastikan bahawa dunia berfungsi . Sekiranya kita bermain dengan ini sedikit lebih banyak, kita berpeluang dengan model seperti ini. Model ini mempunyai garis representasi melalui tengah, dan anda berinteraksi dengan dunia di bawah garis melalui satu set perwakilan.

Interaksi anda tidak pernah dengan perkara itu sendiri. Anda sebenarnya tidak mengubah sistem.

Apa yang anda lakukan ialah anda berinteraksi dengan perwakilan dan perwakilan itu adalah sesuatu tentang apa yang berlaku di bawah. Anda boleh memikirkan perkara-perkara hijau seperti skrin yang anda lihat pada siang hari, tetapi satu-satunya maklumat yang anda ada mengenai sistem ini adalah daripada perwakilan ini. Mereka hanya lubang kunci kecil. Betul kan?

Apa yang penting ialah semua aktiviti yang anda lakukan, semua yang memerhatikan, menyimpulkan, menjangkakan, merancang, membetulkan, semua jenis barangan itu perlu dilakukan melalui perwakilan tersebut, jadi ada dunia di atas garis dan dunia di bawah garis, dan walaupun anda dan kami kebanyakannya bercakap tentang dunia di bawah garis seolah-olah ia sangat nyata, seolah-olah ia sangat konkrit, seolah-olah ia sesuatu yang itulah, di sini adalah kejutan.

Berikut adalah masalah besar - anda tidak akan dapat melihatnya.

Ia tidak wujud. Dalam erti kata sebenar, tidak ada garis bawah yang sebenarnya anda boleh sentuh. Anda tidak pernah melihat kod berjalan. Anda tidak pernah melihat sistem sebenarnya berfungsi. Anda tidak pernah menyentuh perkara itu.

Apa yang anda lakukan ialah anda memanipulasi dunia yang anda tidak dapat melihat melalui satu set perwakilan, dan itulah sebabnya anda perlu membina model-model mental, konsep-konsep, pemahaman tentang apa yang sedang berlaku. Itu adalah perkara yang memandu manipulasi itu. Bukan dunia di bawah garis yang melakukannya. Ia adalah keupayaan konseptual anda untuk memahami perkara-perkara yang telah berlaku pada masa lalu, perkara-perkara yang anda lakukan sekarang dan mengapa anda melakukan perkara-perkara itu, perkara penting, dan mengapa perkara penting sebenarnya penting.

Sebaik sahaja anda mengamalkan perspektif ini, sebaik sahaja anda melepaskan idea yang di bawah garis adalah perkara yang anda hadapi, dan memahami bahawa anda benar-benar bekerja di atas garisan, semua perkara berubah.

Apa yang anda lihat dalam Laporan Stella dan projek dan projek lain yang kami telah terlibat adalah mengambil pandangan itu, dan memahami apa yang sebenarnya bermakna mengambil dunia di atas talian dengan serius. Ini adalah pemergian besar dari banyak perkara yang anda lihat pada masa lalu, tetapi saya fikir ia adalah arahan yang bermanfaat yang perlu kita ambil.

Dalam erti kata lain, aktiviti kognitif ini (lihat di bawah) dalam kedua-dua individu dan secara kolektif dalam pasukan di atas dan di bawah organisasi adalah yang membuat perniagaan benar-benar berfungsi. Sekarang, saya telah mengkaji secara terperinci ini untuk beberapa ketika di sini, dan saya boleh memberitahu anda perkara ini. Ia tidak berfungsi seperti yang kita fikirkan.

Akhirnya, untuk menetapkan bingkai ini, bahagian yang paling penting dari idea ini ialah semua perubahan ini dari masa ke masa. Ia adalah proses dinamik yang sedang berjalan. Inilah unit analisis. Sebaik sahaja kita mengambil bingkai itu, kita boleh bertanya beberapa soalan. Kita boleh bertanya beberapa soalan di atas garis seperti ini.

"Bagaimanakah perisian kami berfungsi dengan betul, berbanding bagaimana ia diterangkan dalam wiki dan dokumentasi dan dalam gambar rajah? Kita tahu bahawa mereka tidak menyeluruh, mereka tidak tepat secara tepat. "

"Bagaimanakah perisian kami pecah, berbanding bagaimana kami fikir ia akan pecah ketika kami merancang perlindungan dan pemutus litar dan pengawal?"

"Apa yang kita buat untuk memastikan semuanya berfungsi?"

Soalan: Bayangkan organisasi anda. Apa yang akan berlaku jika hari ini pada pukul enam semua syarikat anda mengambil tangan dari papan kekunci? Mereka tidak menjawab sebarang halaman. Mereka tidak melihat apa-apa makluman. Mereka tidak menyentuh mana-mana bahagiannya, kod atau rangkaian aplikasi atau mana-mana daripadanya. Adakah anda yakin bahawa perkhidmatan anda akan berjalan dan berjalan selepas sehari?

Persoalannya ialah bagaimana untuk mengetahui apa yang berlaku di atas garis. Nah, ada beberapa perkara. Kita boleh belajar dari kajian domain lain yang berpandangan tinggi dan tinggi, dan jika kita lakukan, kita dapat melihat bahawa kita boleh mempelajari insiden. (Nota: apabila saya berkata "insiden," saya maksudkan padam, degradasi, pelanggaran, kemalangan, hampir-misses, dan gangguan - pada dasarnya tidak diingini atau peristiwa yang tidak dijangka).

Apa yang membuat insiden menarik? Nah, yang jelas kehilangan kesan pendapatan dan reputasi pada perniagaan tertentu. Saya ingin menegaskan beberapa sebab lain mengapa insiden menarik. Yang pertama ialah insiden membentuk reka bentuk subsistem komponen dan arkitek baru. Dalam erti kata lain, insiden semalam memaklumkan kepada arkitek esok. Iaitu, insiden membantu menimbulkan imaginasi kami tentang bagaimana untuk menjadikan sistem kami lebih baik, dan dengan itu apa yang saya maksudkan, insiden di bawah garis pemanduan berubah di atas garisan.

Itulah perkara itu. Ini boleh menjejaskan wang sebenar. Insiden kadang-kadang boleh mempunyai kesan tersirat atau tidak kelihatan, kadang-kadang penting. Kini, ramai orang memisahkan monolit ke perkhidmatan mikro. Ramai orang melakukan itu kerana ia memberikan beberapa kekukuhan yang tidak anda miliki. Di manakah anda mendapatkannya?

Anda dimaklumkan oleh insiden.

Satu lagi sebab untuk melihat insiden adalah bahawa mereka cenderung melahirkan peraturan baru, dasar, norma, pematuhan, pengauditan, kekangan, dan sebagainya. Satu lagi cara untuk mengatakan ini ialah insiden semalam memberitahu aturan esok, yang mempengaruhi kakitangan , belanjawan, perancangan, roadmap dan banyak lagi. Izinkan saya memberikan satu contoh: Dalam perdagangan kewangan, SEC telah menetapkan Peraturan SCI. SCI, mungkin merupakan pematuhan yang paling komprehensif dan terperinci dalam era perisian moden. SEC telah pergi dan sangat jelas. Kami mempunyai ini sebagai reaksi kepada kemalangan flash tahun 2010 kepada Knight Capital, BATS IPO, Facebook IPO. Ini adalah tindak balas kepada insiden.

Walaupun anda kembali sedikit lagi, ia sering menyebut bahawa PCI DSS berlaku apabila MasterCard dan Visa membandingkan nota, menyedari bahawa mereka kehilangan kira-kira $ 750 juta lebih 10 tahun, jadi insiden mempunyai ketara, dan dengan cara itu, saya boleh, sebagai bekas CTO sebuah syarikat awam, saya dapat memberi jaminan bahawa ini adalah sangat mahal, mengganggu, dan tidak dapat dielakkan sebagai albatross yang membebankan bagi semua organisasi anda. Insiden adalah penting dengan cara ini juga, tetapi jika kita berfikir tentang insiden sebagai peluang, jika kita berfikir tentang insiden sebagai mesej, mesej yang dikodkan yang di bawah baris dihantar di atas baris, dan tugas anda adalah untuk membacanya, jika anda berfikir tentang insiden sebagai perkara yang secara aktif cuba mendapatkan perhatian anda terhadap bahagian-bahagian sistem yang anda fikir anda mempunyai pemahaman yang mencukupi tetapi anda tidak melakukannya, ini adalah peringatan bahawa anda perlu terus menimbang semula bagaimana keyakinan anda tentang bagaimana ia berfungsi.

Sekarang, jika anda mengambil pandangan ini, sejumlah besar perkara terbuka. Terdapat peluang untuk latihan baru, alat baru, struktur organisasi baru, dinamik pembiayaan baru dan mungkin pandangan bahawa pesaing anda tidak mempunyai.

Kejadian membantu kami mengukur delta antara bagaimana sistem anda berfungsi dan bagaimana kami berfikir sistem anda berfungsi, dan delta ini hampir selalu lebih besar dari yang kami bayangkan. Saya ingin menegaskan bahawa mungkin berbeza yang anda mungkin gunakan, dan ini adalah perkara ini. Insiden adalah pelaburan tidak terancang dalam perusahaan, dalam survival syarikat anda. Mereka adalah peluang yang sangat berharga untuk memahami bagaimana sistem anda berfungsi, apa kelemahan dalam perhatian wujud, dan apa kelebihan daya saing yang anda tidak mengejar.

Jika anda berfikir tentang insiden, mereka membakar wang, masa, reputasi, kakitangan, dan lain-lain. Ini adalah kos yang tidak dapat dielakkan. Sesuatu yang menarik tentang jenis pelaburan ini, walaupun. Anda tidak mengawal saiz pelaburan, jadi oleh itu persoalannya tetap, bagaimana anda memaksimumkan ROI untuk pelaburan itu?

Apabila kita melihat insiden, ini adalah jenis soalan yang kita dengar, dan ia agak konsisten dengan apa yang ditemui oleh para penyelidik dalam sistem yang kompleks, domain. Apa yang dilakukannya? Mengapa ia berbuat demikian? Apa yang akan dilakukan seterusnya? Bagaimanakah ia masuk ke negeri ini? Apa yang berlaku? Sekiranya kita melakukan Y, adakah ia akan membantu kita memikirkan apa yang harus dilakukan? Adakah semakin teruk? Nampaknya ia tetap, tapi kan? Jika kita melakukan X, adakah ia akan menghalangnya daripada menjadi lebih teruk, atau akan menjadikannya lebih buruk? Siapa lagi yang patut kita panggil yang dapat membantu kita? Adakah isu ini, atau adakah kita diserang? Ini konsisten dengan banyak bidang lain. Penerbangan, kawalan lalu lintas udara, terutamanya dalam domain yang kaya dengan automasi.

Satu lagi perkara yang penting ialah permulaan apa-apa kejadian, ia sering tidak pasti atau samar-samar sama ada atau tidak jika ini adalah yang menyerap kita. Pada awal kejadian, kita tidak tahu, terutamanya jika ia mengandungi sejumlah besar ketidakpastian dan jumlah kekaburan yang besar. Sekiranya ia tidak menentu dan samar-samar, itu bermakna kita telah meletihkan model mental kita. Mereka tidak sesuai dengan apa yang kita lihat, dan soalan-soalan itu timbul. Hanya penunjuk arah akan memberitahu kami jika itu adalah peristiwa yang membawa syarikat itu turun atau jika ia adalah petang Selasa yang sukar.

Insiden menyediakan penentukuran tentang bagaimana keputusan difokuskan, tentang bagaimana tumpuan diberikan perhatian, tentang bagaimana koordinasi difokuskan, tentang bagaimana penekanan tertumpu. Kesan tekanan masa, kesan ketidakpastian, kesan kesamaran, dan kesan akibat. Penyelidikan mengesahkan peluang ini.

"Kita harus melihat secara mendalam pada insiden seperti," kejadian yang tidak rutin, kerana kes-kes yang sukar ini mempunyai potensi terbesar untuk mengungkap unsur-unsur kepakaran dan fenomena kognitif yang berkaitan. "
- Gary Klein, pelukis penyelidikan membuat keputusan semula jadi.

Terdapat keluarga kaedah, pendekatan dan teknik yang dipakai dengan baik. Analisis tugas kognitif. Melacak proses. Analisis perbualan. Kaedah keputusan kritikal. Bagaimana kita berfikir postmortems mempunyai nilai kelihatan sedikit seperti ini:

Kejadian berlaku. Mungkin seseorang akan menyusun garis masa. Kami mempunyai sedikit mesyuarat. Mungkin anda mempunyai template, dan anda mengisi itu, dan kemudian seseorang mungkin membuat laporan atau tidak, dan kemudian anda punya, ya, perkara tindakan, akhirnya. Kami fikir nilai yang paling besar, mungkin mungkin nilai yang paling jelas, adalah di mana anda berada dalam pembacaan dan orang ramai berjalan melalui garis masa dan anda seperti, "Ya, Tuhan saya. Kami tahu semua ini. "

Ini bukanlah apa yang dilakukan oleh penyelidikan. Penyelidikan menunjukan bahawa jika kita mengumpul data subjektif dan objektif dari pelbagai tempat, data tingkah laku, apa yang dikatakan orang, apa yang dilakukan orang, di mana mereka melihat, apakah cara diagnosis yang mereka ikuti dan tidak berbuah? Debriefings yang mudah difahami dapat membezakan dan membandingkan model mental mereka yang semestinya cacat. Anda boleh menghasilkan hasil yang berbeza, termasuk perkara seperti bootcamp, bahan onboarding, latihan sewa baru. Anda boleh mendapatkan maklum balas fasiliti jika anda membina program untuk melatih fasilitator. Anda mungkin membuat perubahan peta jalan, perubahan yang sangat penting berdasarkan apa yang anda pelajari.

Saya boleh memberitahu anda ini dari pengalaman. Tidak ada yang lebih mendalam tentang jurutera baru atau seorang jurutera yang baru memulakan kerjayanya daripada berada di dalam bilik dengan seorang jurutera veteran yang mengetahui semua sudut dan cengkerang yang menerangkan perkara-perkara yang mereka tidak pernah berkata dengan kuat. Mereka mempunyai pengetahuan. Mereka boleh menggambar gambar dan gambar rajah yang mereka tidak pernah menarik sebelum ini kerana mereka fikir semua orang tahu itu. Tahu tak? Mereka tidak. Nilai terbesar sebenarnya di sini, kerana kualiti hasil ini bergantung pada kualiti itu, pengkalanya semula. Ini adalah pembukaan untuk menyusun semula model mental.

Dari Laporan Stella, ia "memberitahu dan mengulang semula model orang tentang bagaimana sistem berfungsi, pemahaman mereka tentang bagaimana ia mudah terjejas dan apa peluang yang ada untuk penjelajahan."

Dalam banyak penyelidikan, dalam semua penyelidikan yang terkandung dalam Laporan Stella, dan sesuai dengan pengalaman saya di Etsy juga, salah satu, refleksi yang paling kuat dari orang-orang yang melakukan ini dengan cara yang mudah untuk melakukan perbandingan ini dan berbeza. "Saya tidak tahu ia berfungsi seperti itu." Kemudian ada yang lain, "Bagaimana ia berfungsi?" Yang lucu sehingga anda menyedari ia serius. Apa itu, cara bukan sahaja saya fikir ia berfungsi dengan cara yang berbeza. Sekarang, saya tidak dapat bayangkan, saya tidak boleh membuat gambar dalam fikiran saya tentang bagaimana ia dapat berfungsi. Itu lebih mustahil. Dengan cara ini, saya ingin mengatakan ini bukan penjajaran. Seperti yang saya katakan, melalui perwakilan, kita semestinya mempunyai model mental yang tidak lengkap. Idea ini tidak mempunyai model mental yang sama, kerana mereka sentiasa tidak lengkap, kerana perkara sentiasa berubah, dan kerana mereka akan cacat. Kami tidak mahu semua orang mempunyai model mental yang sama kerana kemudian semua orang mendapat tempat buta yang sama.

Tidak bercela - kembali ke jawatan blog yang saya tulis pada tahun 2012

"Tidak bercacat" adalah kepentingan meja. Ia perlu, tetapi ia tidak mencukupi. Anda boleh membina persekitaran, budaya, semangat, semacam organisasi yang mengalu-alukan yang menyokong dan membolehkan orang menceritakan kisah dalam semua butiran yang salah, kadang-kadang perkara yang memalukan, tanpa rasa takut balas, supaya anda benar-benar boleh membuat kemajuan, dan dalam memahami apa yang berlaku, anda boleh menetapkan keadaan itu dan masih tidak banyak belajar. Ia tidak mencukupi. Ia perlu, tetapi tidak mencukupi. Apa yang saya bicarakan adalah lebih banyak usaha daripada ulasan khas selepas kejadian. Betul kan? Di sinilah penganalisis, fasilitator boleh membuat persiapan, menyusun, menganjurkan, menganalisis data tingkah laku. Apa yang orang katakan, apa yang orang lakukan. Ada data rakit yang boleh mereka bawa ke prep for debriefings, debriefing kumpulan, atau debriefing satu-satu, melampau ... Postmortems memberi petunjuk kepada kekayaan insiden. Mengikuti hal ini memerlukan banyak kerja.

Dengan cara ini, semua orang biasanya sangat letih setelah benar-benar, gangguan atau kejadian yang teruk atau peristiwa yang kadang-kadang menjadi jelas. Itulah kuasa penglihatan, dan kerana ia kelihatan begitu jelas, nampaknya tidak produktif untuk mendapat pembahasan, kerana anda menganggap anda sudah tahu semuanya. Isu lain ialah taklimat postmortem dikekang oleh masa juga. Anda hanya mempunyai bilik persidangan selama satu atau dua jam. Semua orang benar-benar sibuk, dan jam berdetik, jadi ini adalah satu cabaran untuk melakukan ini dengan baik, walaupun diberikan kaedah penyelidikan.

Isu lain, terutamanya jika anda membina program latihan pemudah cara tontonan seperti yang saya lakukan di Etsy, masih ada cabaran yang muncul. Apa yang saya suka memanggilnya ialah, "Setiap orang mempunyai misteri tersendiri untuk diselesaikan," atau, "Jangan buang masa saya dengan butir-butir yang sudah saya ketahui." Dengan cara kartun, anda boleh memikirkannya dengan cara ini:

Kerana anda hanya mempunyai satu jam, anda perlu mengekstrak sebanyak mungkin pembelajaran anda. Semua kerja adalah konteks. Tugas anda untuk memaksimumkan ROI adalah untuk menemui, meneroka, dan membina semula konteks di mana kerja dilakukan dalam kejadian, bagaimana kerja dan bagaimana orang berfikir di atas garis.

Penilaian adalah perdagangan, dan itu adalah konteks.

Pada penutupan, semua insiden boleh menjadi lebih teruk. Pandangan cetek ialah bertanya, "Apa yang salah? Bagaimana ia pecah? Apa yang kita buat? "Ini adalah soalan yang sangat munasabah. Sekiranya kita mengambil tahap yang lebih mendalam, dan kita boleh bertanya, "Apakah perkara-perkara yang membuatnya tidak begitu buruk kerana ia mungkin?" Kerana kita tidak memperhatikan perkara-perkara itu dan tidak mengenal pasti perkara-perkara itu, kita mungkin berhenti menyokong perkara itu.

Mungkin sebabnya mengapa ia tidak menjadi lebih buruk adalah kerana seseorang memanggil Lisa, dan Lisa tahu barang-barangnya. Sesuatu dari penyelidikan ialah pakar dapat melihat apa yang tidak ada. Jika anda tidak menyokong Lisa, dan anda tidak mengenal pasti bahawa sebab mengapa ia tidak menjadi lebih teruk adalah kerana Lisa berada di sana. Lupakan perkara tindakan untuk menetapkan sesuatu untuk seketika. Bayangkan dunia di mana Lisa pergi ke pekerjaan baru.

Berguna di peringkat strategik adalah soalan yang lebih baik. "Bagaimanakah kita boleh menyokong, menggalakkan, menganjurkan, dan membiayai proses pemahaman berterusan dalam sistem kita? Dan benar-benar mengambil "di atas garis" dengan cara yang berterusan?

Di manakah kita pergi dari sini? Saya mempunyai beberapa cabaran untuk anda:

  1. Alihkan Laporan Stella di syarikat anda dan mulakan dialog. Walaupun anda terlalu sibuk atau anda tidak berada dalam kedudukan untuk membacanya sendiri, berikan kepada orang yang melakukannya. Tanya kepada mereka apa yang bergema. Tanya mereka apa yang tidak masuk akal. Tanya mereka, mulakan dialog.
  2. Lihatlah dengan mendalam bagaimana anda mengendalikan ulasan pasca acara. Yang paling penting, pergi mencari orang yang paling biasa dengan butir-butir yang berantakan tentang bagaimana kerja dapat dilakukan dan bertanya kepada mereka ini: "Apa nilai yang anda fikir ulasan pasca insiden semasa kami benar-benar ada?" Dan dengar.
  3. Mengambil tanggungjawab untuk belajar lebih banyak dan lebih cepat daripada insiden daripada pesaing anda. Anda sama ada membina sebuah organisasi pembelajaran atau anda kehilangan seseorang.
  4. Kita perlu mengambil serius prestasi manusia. Perbincangan ini berlaku. Ia berlaku dalam kuasa nuklear. Ia berlaku dalam bidang perubatan. Ia berlaku dalam penerbangan, kawalan lalu lintas udara, dalam memadam kebakaran.

Semakin pentingnya sistem kami, potensi yang semakin meningkat untuk kerosakan ekonomi, politik, dan manusia ketika mereka tidak berfungsi dengan baik, dan percambahan ketergantungan dan ketidakpastian terkait semuanya membuat saya sangat risau. Jika anda melihat sistem anda sendiri dan masalahnya, saya fikir anda akan bersetuju bahawa kita perlu melakukan lebih banyak daripada mengakui masalah ini. Kita perlu merangkulnya. Apa yang anda boleh membantu saya, sila nyebarkan maklumat ini, idea-idea ini dan persembahan saya dari Sidang Kemuncak DevOps Enterprise San Francisco 2017.

Saya ingin mendengar daripada anda. Apa yang bergema dengan anda mengenai perkara ini? Apa yang tidak? Apakah cabaran yang anda hadapi dalam org anda sepanjang garis ini? Marilah beritahu saya. Saya di Twitter.

Originally diterbitkan di itrevolution.com pada 30 April, 2018.