"Kertas Morning" pada tahun - Edisi 2018

Berlanjut dalam tradisi masa saya yang terhormat sejak penubuhannya sepanjang tahun 2017, di sini adalah senarai pendapat saya yang paling menarik / paling menarik / paling berkaitan / yang paling menarik yang dipaparkan dalam The Morning Paper oleh Adrian Colyer yang luar biasa semasa kursus tahun lepas.

AI dan sebagainya

Masalah konkrit dan keselamatan AI

Di antara tekno-utopian AI dan nabi-nabi kiamat AI menipu kutu AI, hanya mengamuk memikirkan masalah. Penulis mewakili beberapa institusi marquee yang bekerja di kawasan ini dan reputasi mereka memastikan bahawa kami akan memberi perhatian. Taxonomies membantu menyaring pengetahuan bidang ke dalam potongan-potongan yang dicerna, dan kertas ini memberikan formula-formula yang ringkas dan ringkas seperti "penggodaman pahala". (Mereka hanya boleh mengambilnya setakat ini, akhirnya mengalah kepada "kerapuhan dalam menghadapi peralihan distribusi", apabila "kekeliruan dalam persekitaran yang tidak dijangka" akan dilakukan dengan baik.) Jokes mengetepikan, kertas itu sangat mudah diakses dan para penulis melakukan yang hebat kerja dengan contoh. Bercakap tentang robot yang memecahkan gandum supaya mereka dapat mengoptimumkan ganjaran pembersihan, perkara paling lucu untuk saya ialah kita tahu robot / ejen akan mempunyai masalah ini dengan fungsi objektif yang mudah - bagaimanapun, tidakkah manusia mempunyai masalah tersebut sepanjang masa? (Cerita kiasan mengenai pemaju yang membenarkan pepijat dalam kod mereka supaya mereka boleh mendapatkan bonus pepijat bug.)

Peraturan EU tentang membuat keputusan algoritma

Apabila akhbar berteknologi, akhbar arus perdana, dan Berita Hacker semua bercakap dengan tenang, nada hormat tentang peraturan EU - peraturan EU! - Anda pasti yakin sesuatu berlaku. Nah, apa yang sedang berlaku adalah serangan mungkin (dan mungkin tidak disengaja sepenuhnya) di tengah-tengah peraturan penilaian AI yang tidak terucapkan: bukti itu adalah hasil, yang lain akan dikutuk. Sehingga peraturan itu sebenarnya diuji dengan cabaran undang-undang, atau mungkin beberapa cabaran undang-undang, skop penuhnya tetap menjadi perkara tafsiran dan spekulasi. Walau bagaimanapun, pemberian algoritma mangsa (atau "subjek") hak untuk mengetahui mengapa keputusan dibuat menjadikan dijelaskan suatu cadangan [m | b] jutaan dolar.

Statistik yang sama, graf yang berbeza

Saya memilih ini hanya untuk T. Rex, untuk jujur.

Mencari seni bina neural dengan pembelajaran tetulang

Kertas ini adalah salah satu yang menonjolkan beberapa penyelidikan aktif yang berlaku di persimpangan suku-suku Pedro Domingos The Algorithm Master. Kenneth Stanley muncul cukup kerap dalam urat ini dengan artikel, ceramah, dan podcast mengenai neuroevolution.

Peralihan dinamik antara kapsul

Kemasukan wajib. Kami tidak tahu lagi bagaimana kesannya ini, tetapi beberapa karya terdahulu Hinton telah membuktikan, kami akan mengatakan dengan kurang teliti kasar, "agak berguna".

Penalaan sistem pengurusan pangkalan data automatik

Di dunia lama yang membosankan sistem perusahaan lama yang membosankan, pentadbir secara rutin terharu oleh tombol konfigurasi. Senang mengetahui orang berfikir tentang pentadbir itu juga. Hooray! ML bukan hanya tentang memberitahu anjing panas dan pengambilan emas selain. Larry Ellison menghidupkan pemasaran sehingga 11 dengan pengumumannya mengenai Oracle Database Oracle Awan di Oracle OpenWorld 2017, tetapi telah banyak penyelidikan yang sedang dijalankan mengenai topik ini.

Ini membawa cabaran yang besar. Yang lebih legap kotak hitam mendapat - dan kebanyakan perisian perusahaan adalah kotak yang cukup legap - semakin banyak pengguna akan terlepas mempunyai kawalan ke atas tingkah kotak hitam itu. Ini akan dikompaun oleh fakta bahawa, kemungkinan besar, walaupun pembina kotak hitam sering tidak dapat menjelaskan dengan memuaskan mengapa kotak hitam melakukan apa yang dilakukannya.

Jadi apa yang perlu dilakukan? Alternatif isyarat seperti kaedah Bayesian.

BOAT: Membina penala automatik dengan pengoptimuman Bayesian berstruktur

Dan peserta kedua ke topik pengoptimuman sistem. Satu aspek yang menarik dari makalah ini kepada saya adalah bahawa ia seolah-olah menjadi sebahagian daripada kebangkitan semula minat dalam kaedah Bayesian, sebahagiannya sebagai respons terhadap keinginan kuat untuk dijelaskan dalam sistem sedemikian. Tidak mungkin semua yang menarik untuk "memahami" bagaimana model menggambarkan gaya lukisan Van Gogh di Starry Nights, tetapi pasti akan menarik jika gear rangkaian memutuskan bahawa menamatkan sambungan tertentu "lebih baik secara keseluruhan" dan kemudian tidak mampu untuk menjelaskan kepada pengguna yang marah bagaimana ia menentukan bahawa untuk menjadi kes itu.

Kejuruteraan perisian

Memahami ketangkasan perisian

Ia tidak cukup mengatakan dengan cara ini, tetapi kertas itu berpendapat bahawa kita juga sering terperangkap dalam perangkap Kecenderungan Survivorship - memulihkan semula nilai ramalan, di mana tidak ada, untuk pelbagai tindakan yang diambil atau peristiwa yang berlaku. Sebaliknya, adalah wajar untuk menerima kerumitan (yang bertentangan dengan semata-mata rumit) dari ssytem - orang, perniagaan, teknologi, kod, ... - dan mengambil pendekatan mengambil langkah-langkah kecil, memerhatikan kesan langkah itu, mengkaji sebarang perubahan dalam alam sekitar, menyesuaikan diri dengan keperluan, dan kemudian mengambil satu lagi langkah kecil. Orang ML memanggilnya "keturunan kecerunan". Kejuruteraan perisian memanggilnya "Agile". Memimpin saya kembali ke titik di mana saya bersetuju yang paling, tepat berhampiran awal kertas, yang Adrian meringkaskan demikian:

semangat asal Agile sering diganti oleh kargo-karat peraturan dan senarai semak

Pembedahan proses pembangunan berasaskan ujian

Berikut adalah kertas kedua yang mengkaji fenomena yang seolah-olah bekerja dengan baik dalam amalan dan cuba untuk mengamalkannya dengan teori. Saya mengesyaki kertas itu akan mendapat sambutan yang baik oleh orang-orang di kedua-dua belah jurang agama di sekitar TDD kerana satu perkara yang mereka persetujui adalah aturan kelompok kecil (Toyota, Lean, dan sebagainya).

Bagaimana sistem yang kompleks gagal

Menarik dengan baik untuk sistem perisian walaupun pengarang adalah MD dan menulis dari perspektif penjagaan kesihatan! Dianjurkan sebagai satu siri pemerhatian, yang sangat menakjubkan (mungkin ini bercakap tentang betapa terhadnya pengetahuan saya) berapa banyak daripada mereka memohon secara langsung kepada sistem perisian. Pemerhatian terbaik bagi pihak saya pada pendapat saya ialah "Oleh itu, sistem-sistem yang kompleks dikendalikan dalam mod yang terdegradasi sebagai mod operasi biasa mereka", tetapi terdapat beberapa nota nota, misalnya, mengenai bahaya yang RCA penuh dengan, dan pengeluar / keseimbangan pengendali dan apa yang berlaku apabila mereka adalah orang yang sama. Dengan hanya sedikit dos pengesahan bias, tidak sukar untuk melihat semua cara yang menyokong Agile, Lean, dan DevOps.

Awan

Pengkomputeran tanpa pelayan: kesan ekonomi dan seni bina

Yang pertama sepasang kertas di pergeseran paradigma yang dipanggil serverless. Kepada saya, nama itu memberitahu: tentunya ada pelayan di mana sahaja melaksanakan kod, tetapi kepada pemaju, tidak ada pelayan. Serverless membuat pengkomputeran awan semua tentang kod - pembangun perlu bimbang tentang apa-apa lagi. Sudah tentu, kertas ini sangat nuts-dan-bolt, dolar dan sen, kebaikan dan keburukan. Fikirkan ia sebagai versi akademik penyampaian kepada CFO dan CIO, atau Radar Technology ThoughtWorks. Ia tidak direka untuk meyakinkan sesiapa sahaja daripada apa-apa, tetapi ia meletakkan tanpa pengantar di alam, kita akan mengatakan, dengan cukup difahami.

Menduduki awan

Vinod Khosla, sekali royalti Silicon Valley, pernah berkata pada satu persidangan, "Perubahan adalah satu-satunya perkara yang boleh dioptimumkan." Tuan-tuan dan puan-puan, saya beri anda: tanpa pelayan. Ini kedua sepasang kertas yang saya sukai pada topik ini adalah lebih daripada satu pernyataan wawasan yang lebih luas yang cuba membina sokongan untuk menegaskan bahawa manfaat dari seni bina yang sangat merosot dengan memfokuskan pada nilai pengoptimuman yang semakin berkurangan seperti pengkomputeran / colocation data, mencatat bahawa "penulisan AWS EC2 ke penyimpanan jauh lebih cepat daripada menyimpan data pada satu SSD tempatan". Kertas tidak mungkin meyakinkan skeptis, tetapi ia pasti akan melemahkan tentangan mereka. Saya mengambil sedikit masalah dengan rumusan "komputer yang diedarkan untuk 99%". Saya lebih suka mengatakan "pengkomputeran awan untuk 99%" - memberi mereka 99% cara untuk menggunakan awan tanpa bimbang (terlalu banyak) mengenai pengkomputeran yang diedarkan.

Spanner

Ini adalah jenis kemasukan mandatori, apa dengan semua gembar-gembur di sekelilingnya. Global! Diedarkan! Tiada ops! ACID! CAP! Jam atom! Pengumuman ini mempunyai nilai kesejukan yang jauh melebihi geekdom pangkalan data.

BRR: kawalan kesesakan berasaskan kesesakan

Untuk kertas terakhir dalam senarai saya, inilah kelulusan kepada apa yang membayar bil saya - rangkaian. Sebagai unsexy sebagai paip, sebagai penting, dan sebagai sukar untuk membersihkan apabila perkara menyumbat. Sebaik sahaja mengetepikan, pengambilan mengambang adalah masalah yang tidak dapat difahami dengan jelas dalam rangkaian ("biasa" rasa dan semua itu), dan sesuatu yang saya pelajari dari rakan sekerja pakar di Citrix ketika mengusahakan Pengoptimal WAN dan sebagainya. Adrian disampaikan mungkin visualisasi terbaik dari blognya 2017 yang menerangkan masalah pengendalian kesesakan TCP dan bagaimana BRR membincangkannya.

Jadi di sana anda memilikinya. Banjir maklumat berterusan dan terima kasih kepada usaha pengukuhan Adrian Colyer, kita dapat secara bermakna mencerna sepotong itu.

Menantikan pilihan Adrian untuk 2018!

Kertas Bonus

Gunakan "virtualisasi asli awan". Himpunan penghormatan yang diketahui oleh psikoterapi begitu pas. Juga dikenali sebagai "cloud adalah sistem operasi baru".

Walaupun penggunaan skala web mereka adalah biasa, mengira penapis seolah-olah sangat berguna tetapi membina terlalu kurang digunakan dalam rangkaian. Saya tertanya kenapa.